Использование языка Python для доступа к веб-данным

Description

Этот курс покажет, как можно использовать Интернет в качестве источника данных. Мы рассмотрим скрейпинг, парсинг и чтение веб-данных, а также получение доступа к данным с помощью web API. Мы будем работать с форматами данных HTML, XML и JSON на Python. Этот курс будет охватывает главы 11–13 учебника «Python для всех» (Python for Everybody). Чтобы успешно пройти этот курс, вы должны быть знакомы с материалами, изложенными в главах 1–10 учебника и первых двух курсах по данной специализации. Эти темы включают переменные и выражения, условные операторы (циклы, ветвление и исключения: try/except), функции, структуры данных Python (строки, списки, словари и кортежи), а также манипулирование файлами. В этом курсе рассматривается Python 3.

What you will learn

Начало работы

В этом разделе вы установите Python и текстовый редактор. В предыдущих курсах специализации это было необязательно, но в этом классе это станет первым требованием перед началом обучения. С этого момента мы прекращаем использовать среду оценки Python на основе браузера, потому что такая среда (а именно Skulpt) не способна выполнять сложные программы, которые мы будем разрабатывать в ходе этого курса.

Регулярные выражения (глава 11)

Регулярные выражения (RegEx) — это специализированный язык, который позволяет быстро искать строки и извлекать данные из них. RegEx — это самостоятельный язык программирования. Изучать регулярные выражения на этом курсе не обязательно, но они представляют собой мощный инструмент и могут принести большую пользу.

Сети и сокеты (глава 12)

Из этого раздела вы узнаете о протоколах, которые веб-браузеры используют для получения документов, а также о веб-приложениях, которые используются для взаимодействия с интерфейсами прикладных программ (API).

Программы для просмотра Интернета (глава 12)

Из этого раздела вы узнаете, как использовать Python для извлечения данных с веб-сайтов и из API через Интернет.

What’s included