Я тут понял, почему я занимаюсь парсингом:



🔸 Количество данных растет -> Бум аналитиков / DS

🔸 Чтобы что-то обучать и анализировать, нужно собрать датасет

🔸 Я могу)



Датасеты, которые у меня есть:

▪️ Картинки, Юзеры, Соцграф из Instagram (50М)

▪️ Геолокации / бизнесы из Instagram & Facebook (5М)

▪️ База товаров из Wildberries (5М) и Ozon (10М)

▪️ Данные из GitHub, Angellist (100k), старый Crunchbase

▪️ Немного Clubhouse, немного Producthunt, немного Tinder

▪️ Мемы (100к), мем паблики вк, тг, инста, реддит (200)

▪️ Что-то еще, что я забыл