Description
Этот курс покажет, как можно использовать Интернет в качестве источника данных. Мы рассмотрим скрейпинг, парсинг и чтение веб-данных, а также получение доступа к данным с помощью web API. Мы будем работать с форматами данных HTML, XML и JSON на Python. Этот курс будет охватывает главы 11–13 учебника «Python для всех» (Python for Everybody). Чтобы успешно пройти этот курс, вы должны быть знакомы с материалами, изложенными в главах 1–10 учебника и первых двух курсах по данной специализации. Эти темы включают переменные и выражения, условные операторы (циклы, ветвление и исключения: try/except), функции, структуры данных Python (строки, списки, словари и кортежи), а также манипулирование файлами. В этом курсе рассматривается Python 3.
What you will learn
Начало работы
В этом разделе вы установите Python и текстовый редактор. В предыдущих курсах специализации это было необязательно, но в этом классе это станет первым требованием перед началом обучения. С этого момента мы прекращаем использовать среду оценки Python на основе браузера, потому что такая среда (а именно Skulpt) не способна выполнять сложные программы, которые мы будем разрабатывать в ходе этого курса.
Регулярные выражения (глава 11)
Регулярные выражения (RegEx) — это специализированный язык, который позволяет быстро искать строки и извлекать данные из них. RegEx — это самостоятельный язык программирования. Изучать регулярные выражения на этом курсе не обязательно, но они представляют собой мощный инструмент и могут принести большую пользу.
Сети и сокеты (глава 12)
Из этого раздела вы узнаете о протоколах, которые веб-браузеры используют для получения документов, а также о веб-приложениях, которые используются для взаимодействия с интерфейсами прикладных программ (API).
Программы для просмотра Интернета (глава 12)
Из этого раздела вы узнаете, как использовать Python для извлечения данных с веб-сайтов и из API через Интернет.