«Нашло то, что спрашивал, но не то, что искал» — подкаст про ранжирование и ретривел



Прежде чем стать хэдом оф дата сайнс в Вайлдберриз Саша Сидоров прошел большой путь в поиске и ранжировании.



В подкасте конференции I'ML Саша постарался приблизить нас всех к пониманию разницы между свитером, джемпером и зипкой:



— почему важно понимать как устроена математика под капотом у ML-моделей?

— как сделать крутое ранжирование быстро, дешево и сердито в 2024 году?

— как мультимодальные трансформеры в маркетплейсе помогают лучше понять контекст запроса пользователя на основании разных данных?

— как рассчитать количество видеокарт, необходимых для работы дата-центров, обработки данных и обучения моделей?

— баланс при разработке высоконагруженных ML-сервисов: масштабируемость, инфраструктура и сроки.



Обсудили BERT, TwinBERT, DLRM, mCLIP, BST, Yolo, ViT, DINO и NN. Поговорили про оркестрацию моделей, кластеризацию и эмбеддинги и, конечно же, о том, как создать инфраструктуру под растущие нагрузки.



#wbtech #wbds #wbspeakers #wbpodcast