ML for Value / Ваня Максимов

В чем моя суперсила в ML?

Смотрю аниме Blue lock. Там топ-300 футбольных нападающих тренируются вместе и соревнуются между собой, чтобы остался один лучший. Главный герой задумывается, как определить свою суперсилу (дрибблинг, скорость, точный удар, ...) и возвести ее в абсолют, чтобы победить

И вот я задумался, а в чем моя суперсила в ML?

Не то чтобы я самый мощный кодер, или читаю SOTA на следующий день после ее выхода

Но в чем я точно хорош - это ML system design (эго распирает, да 👑)

ML system design состоит из нескольких кусочков - попробую описать, что помогает мне в каждом

🎯 Понимание, чего хочет бизнес + перевод этого в метрики

Тут конечно бэкграунд в экономике здорово помогает. Довольно хорошо разбираюсь в юнит экономике, моделях монетизации и P&L

Если не знаете, что это - мой настоятельный рекомендасьон ознакомиться)

Одержимость метриками бизнеса даже привела к тому, что я строил несколько АВ-платформ и не раз спорил с фин директором про метрики 😅

💡Навык разглядеть потенциал в данных

Как-нибудь надо записать курс про то, что можно творить простейшими преобразованиями данных

В Лавке, например, нам удалось достичь очень многого... упрощением данных. Перешли от прогноза спроса на склад-час-товар к прогнозу на город-день-товар. Очевидные зависимости (типа в следующий понедельник продадим +- столько же, сколько в прошлый) учли эвристикой, а катбустом прогнозировали уже ее ошибки. Подробнее я рассказывал на ML Conf

🦾 Модель в моменте и потенциал ее развития

Тут играет на руку опыт в разных сферах: от классических прогноза спроса и оптимизации цен до рекомендаций, uplift-моделей и NLP

Если ~~долго смотреть в бездну, то она взглянет на тебя~~ делать разные модели, то начинаешь видеть очень много общих кусков. Например, рекомендации, uplift и оптимизация цен - невероятно похожие задачи по своей сути. В них даже ключевой подводный камень одинаковый: каннибализация. Про нее, кстати, аж 4 года назад рассказывал на конфе от Х5

Ну и удается продумывать не только как построить модель сейчас, но и как сделать ее улучшаемой и масштабируемой. Как-то даже с лидом поиска в Delivery Сlub залетели на Highload++ с рассказом про применение одной ML-модельки в поиске, которая изначально вообще была не для него. Но легко масштабировалась и в итоге применялась в поиске, рекомендациях, маркетинге и аналитике

🪄 Вжух, вжух и в продакшен

Довелось и батч джобы обвешивать мониторингами с алертами, а сервисы на fastapi писать, и даже вместе с mlops продумывать архитектуру go-шного риалтайма

Но все это обьединяла идея: давайте научимся катить в прод очень быстро и надежно. И получалось же!)

Тут описал далеко не все, но, пожалуй, хватит сегодня ссылок на мои выступления 😊

#personal