Парсинг сайтов. Scrapy, Splash, Selenium, requests, bs4. (2021)



🎯После прохождения курса вы сможете пояснить🙃 за:



• Как найти и установить необходимые библиотеки для парсинга данных.

• Что такое этичный парсинг, как не нарушить права и закон при парсинге данных.

• Для чего нужен файл robots.txt.

• Каким образом получать HTML сайта для извлечения необходимой информации.

• Как пользоваться xpath для указания точного расположения элементов на странице.

• Как переходить по страницам на многостраничном сайте.

• Как создавать проект и запускать «пауков» Scrapy.

• Как парсить всю информацию о каждом товаре на сайте.

• Как осуществлять переход на страницу каждого товара.

• Каким образом парсить сайты, использующие JavaScript при загрузке.

• Как авторизовываться на сайте, используя фреймворк Selenium.

• Как парсить сайты с бесконечной прокруткой, имитируя действия пользователя на странице.



🟢 Скачать курс



#python