
«Нашло то, что спрашивал, но не то, что искал» — подкаст про ранжирование и ретривел
Прежде чем стать хэдом оф дата сайнс в Вайлдберриз Саша Сидоров прошел большой путь в поиске и ранжировании.
В подкасте конференции I'ML Саша постарался приблизить нас всех к пониманию разницы между свитером, джемпером и зипкой:
— почему важно понимать как устроена математика под капотом у ML-моделей?
— как сделать крутое ранжирование быстро, дешево и сердито в 2024 году?
— как мультимодальные трансформеры в маркетплейсе помогают лучше понять контекст запроса пользователя на основании разных данных?
— как рассчитать количество видеокарт, необходимых для работы дата-центров, обработки данных и обучения моделей?
— баланс при разработке высоконагруженных ML-сервисов: масштабируемость, инфраструктура и сроки.
Обсудили BERT, TwinBERT, DLRM, mCLIP, BST, Yolo, ViT, DINO и NN. Поговорили про оркестрацию моделей, кластеризацию и эмбеддинги и, конечно же, о том, как создать инфраструктуру под растущие нагрузки.
#wbtech #wbds #wbspeakers #wbpodcast
Прежде чем стать хэдом оф дата сайнс в Вайлдберриз Саша Сидоров прошел большой путь в поиске и ранжировании.
В подкасте конференции I'ML Саша постарался приблизить нас всех к пониманию разницы между свитером, джемпером и зипкой:
— почему важно понимать как устроена математика под капотом у ML-моделей?
— как сделать крутое ранжирование быстро, дешево и сердито в 2024 году?
— как мультимодальные трансформеры в маркетплейсе помогают лучше понять контекст запроса пользователя на основании разных данных?
— как рассчитать количество видеокарт, необходимых для работы дата-центров, обработки данных и обучения моделей?
— баланс при разработке высоконагруженных ML-сервисов: масштабируемость, инфраструктура и сроки.
Обсудили BERT, TwinBERT, DLRM, mCLIP, BST, Yolo, ViT, DINO и NN. Поговорили про оркестрацию моделей, кластеризацию и эмбеддинги и, конечно же, о том, как создать инфраструктуру под растущие нагрузки.
#wbtech #wbds #wbspeakers #wbpodcast