В поисках SOTA для рекомендательных систем



Однозначный лидер есть и в табличках (бустинг), и в LLM (GPT-4, Claude 3) и много где еще. Но в мире рекомендаций его нет!



На paperswithcode на каждом датасете свой лидер: ALS, EASE, SASRec,… где-то даже tf-idf 😅



Крупнейшие компании абсолютно по-разному строят свои рек системы. EBay ушел в кластеризацию товаров + поиск похожих, Pinterest полюбил трансформеры, при этом кое-где зажигает и классический ALS



На мой взгляд, SOTA нет, потому что задача «рекомендаций» в каждой индустрии своя



В соц сетях часто нужно показывать новые посты от любимых авторов/друзей. В фильмах - популярные сейчас и похожие. В продуктовом ритейле - стандартную корзину покупателя (повторные покупки)



Хотите поэкзотичнее? В одежде чуть ли не главный челлендж - учет размера 📐

По некоторым прикидкам, если онлайн-ритейлеры одежды с этим справятся и снизят возвраты, то это похоронит оффлайн магазины одежды



В общем, сфера рекомендаций не так проста, как кажется 💯



P.S. Если знаете клевые рек модели в вашей индустрии - пишите в комментарии, очень интересно 🧐

#recsys