Я тут понял, почему я занимаюсь парсингом:
🔸 Количество данных растет -> Бум аналитиков / DS
🔸 Чтобы что-то обучать и анализировать, нужно собрать датасет
🔸 Я могу)
Датасеты, которые у меня есть:
▪️ Картинки, Юзеры, Соцграф из Instagram (50М)
▪️ Геолокации / бизнесы из Instagram & Facebook (5М)
▪️ База товаров из Wildberries (5М) и Ozon (10М)
▪️ Данные из GitHub, Angellist (100k), старый Crunchbase
▪️ Немного Clubhouse, немного Producthunt, немного Tinder
▪️ Мемы (100к), мем паблики вк, тг, инста, реддит (200)
▪️ Что-то еще, что я забыл
🔸 Количество данных растет -> Бум аналитиков / DS
🔸 Чтобы что-то обучать и анализировать, нужно собрать датасет
🔸 Я могу)
Датасеты, которые у меня есть:
▪️ Картинки, Юзеры, Соцграф из Instagram (50М)
▪️ Геолокации / бизнесы из Instagram & Facebook (5М)
▪️ База товаров из Wildberries (5М) и Ozon (10М)
▪️ Данные из GitHub, Angellist (100k), старый Crunchbase
▪️ Немного Clubhouse, немного Producthunt, немного Tinder
▪️ Мемы (100к), мем паблики вк, тг, инста, реддит (200)
▪️ Что-то еще, что я забыл