Как вы наверное помните, в ElfinDay есть функция поиска подарков под конкретного человека, которую я активно бустил несколько последних дней. В первой версии она просто собирала техническую информацию со страницы цели, обеспечивая самые очевидные фильтры по возрасту и полу, однако для нормальных рекомендаций необходимо чуть больше узнать о самом человеке, его хобби и интересах. Не буду утруждать вас долгим описание различных эксперементов, но поделюсь несколькими интересными находками, которые позволили +- адекватно угадывать интересы человека.

1. 99% постов на странице это страдания и какой-то бред никак не коррелирующий с интересами. (по крайне среди моих друзей)

2. пройдясь по списку подписок и оценив количесво лайков среди первых 100 постов, выделяем 20 групп которые человек чаще всего лайкает, в каждой ищем по 10 самых популярных существительных, которые также встречались среди описание наших товаров в бд.

3. с 5тикратным весом выделяем топ 10 существительных из его репостов на стену, там обычно весьма информативные посты из групп (ну или мемы тогда сразу кидаем в товары для детей 12-17).

4. приводим все существительные в инфинитив с помощью ufal.udpipe

5. смотрим название групп, добавленных видосов и коментов под фото в альбомах, также берем только существительные

6. ищем ссылки на странице, парсим их, собираем все <h1/>и tittle (обычно это описание сайтов)

7. Объединяем все в 1 кучу и отображаем в вектор по словарю, ищем пересечения с описанием товаров.

Такой подход дал довольно адекватные keywords а анализ только тех слов, которые были среди названий товаров помог отбросить почти всю воду, не связанную с хобби и интересами не используя DL. В пн новая моделька будет в проде, приглашаю всех потестить мои старания.