Вы уже знаете, что я парсю Angellist.com, потому что это



🔹 сложно (много защит разного уровня)

🔹 нудно (много ручной работы по вытаскиванию данных со страниц)

🔹 познавательно (по ходу я знакомлюсь со всеми промышленными стандартами парсинга).



Пока я учился, у меня собрался небольшой датасет грязных данных из Angel.co. Делюсь им со своими подписчиками - вдруг кому-нибудь нужен. Парсил в основном вакансии для удалёнщиков:



https://docs.google.com/spreadsheets/d/1u7-ytby2TzSQPm2r-G-SxC193zhaUh_Pqp3Nq0kp_YQ/edit#gid=0