Автоматизація парсингу сайтів на Python
В эру машинного обучения информация становится нефтью 21го века. Проекты, связанные со сбором и анализом данных, выходят на первые позиции в глобальных компаниях и в стартапах.
Как собирать и обрабатывать информацию? В зависимости от целей проекта данные могут собираться абсолютно разные. На вебинаре мы рассмотрим один из наиболее распространенных подходов – парсинг сайтов.
Мы возьмем один из популярных сайтов с рабочими вакансиями и на его примере разберем библиотеки для парсинга веб-сайтов, библиотеки для работы с запросами. Разберем виды популярных баз данных и поймем где и какую нужно использовать.
План вебинара:
- Что такое парсинг веб-сайтов.
- Библиотеки для парсинга веб-сайтов.
- Библиотеки для работы с сетью.
- Написание кода парсеров.
- SQL и NoSQL - при каких задачах, какой тип используется.
- Написание кода менеджеров баз данных.
Целевая аудитория:
Данный вебинар будет полезен для людей, понимающих синтаксис языка Python и принципы объектно-ориентированного программирования, перед которыми стоит задача автоматизации сбора данных посредством парсинга сайтов.
01.01.1960
120
1435
01.01.1960
120
1071
01.01.1960
120
1322
01.01.1960
120
2851
01.01.1960
120
2829
01.01.1960
120
1379
01.01.1960
120
970
01.01.1960
120
1832
01.01.1960
120
2668
01.01.1960
120
5570
01.01.1960
120
2164
01.01.1960
120
2530