ML for Value / Ваня Максимов

ML4RecSys: что происходит? февраль 2024

Последнее время читаю про недавние прорывы в рекомендательных системах... и там все очень сомнительно

Даже не верится что в 2024 году в статьях с топовых конференций классические «стажерские» ошибки:

- неправильный train-test split

- сравнение с явно недо-тюнеными бейзлайнами

- выбор для сравнения только тех датасетов, где модель побеждает…

Поэтому выудить что-то явно работающее очень сложно 😕

Тем не менее, на мой взгляд, в адекватных статьях взлетели:

- Трансформеры для отбора кандидатов

- Разные стратегии поиска Hard negatives (покупка - позитивный таргет, но найти хороший негативный - занятная задача)

- Таргет более близкий к деньгам (не клики, а хотя бы клики дольше 10 сек)

Дальше уже разные топ компании репортят совсем разные вещи:

- У одних лучше encoder (BERT4Rec), у других - decoder модели (SASRec)

- Как будто огромное значение играет не архитектура, а выбор данных / как берут негативы / лосс

- В академии SOTA показывают модели с дополнительным contrastive loss, но в индустрии этого пока не видно

- Почти у всех проблемы метча оффлайн/онлайн метрик или рост конверсии + падения чека, но никто не говорит, как с этим справляется

- Многие внедряют разнообразие / novelty в рекомендации через постпроцесинг без всякого ML

- Как будто градиентый бустинг для ранжирования все еще на уровне с SOTA

В общем, пока инженерный подход в рекомендациях решает 🔥

Если вы знаете прикольные открытия / рабочие инженерные подходы в RecSys, делитесь в комментариях ⬇️