Вы уже знаете, что я парсю Angellist.com, потому что это
🔹 сложно (много защит разного уровня)
🔹 нудно (много ручной работы по вытаскиванию данных со страниц)
🔹 познавательно (по ходу я знакомлюсь со всеми промышленными стандартами парсинга).
Пока я учился, у меня собрался небольшой датасет грязных данных из Angel.co. Делюсь им со своими подписчиками - вдруг кому-нибудь нужен. Парсил в основном вакансии для удалёнщиков:
https://docs.google.com/spreadsheets/d/1u7-ytby2TzSQPm2r-G-SxC193zhaUh_Pqp3Nq0kp_YQ/edit#gid=0
🔹 сложно (много защит разного уровня)
🔹 нудно (много ручной работы по вытаскиванию данных со страниц)
🔹 познавательно (по ходу я знакомлюсь со всеми промышленными стандартами парсинга).
Пока я учился, у меня собрался небольшой датасет грязных данных из Angel.co. Делюсь им со своими подписчиками - вдруг кому-нибудь нужен. Парсил в основном вакансии для удалёнщиков:
https://docs.google.com/spreadsheets/d/1u7-ytby2TzSQPm2r-G-SxC193zhaUh_Pqp3Nq0kp_YQ/edit#gid=0