Жизненный цикл моделей на примере задачи self-driving



🤔 Как показать обывателю чем занимаются дата сайентисты на самом деле? Нужно попросить их собрать MVP наглядного, популярного и одновременно полезного продукта за короткий промежуток времени. В рамках него показать ключевые элементы жизненного цикла моделей: постановки задачи, сбора данных, разработки модели, внедрения модели, тестирования модели и быть может даже мониторинга ее качества.



🚘 Решение задачи автопилота на игрушечных машинках с мозгами из микрокомпьютеров стало идеальным форматом для реализации намеченной цели. Потребовались небольшие денежные инвестиции и порядка пяти часов работы от шести команд дата сайентистов. Комбинация динамичного формата соревнования и интервью с self-driving командой из yandex стало отличным продюсерским решением от @flesspro и собрало на ютубе порядка 140 тысяч просмотров на данный момент (одна социальная сеть напомнила об этом спустя четыре года)



🤬 У нашей команды решение задачи было максимально приближенно к реальным будням работы дата сайентиста, ведь в этом проекте пошло не так практически все: сначала не работал джойстик у машинки, потом мы не могли к ней поключить с эппловской техники (другой в команде не было), а под конец у нас сел аккумулятор на машинке. Однако это было соревнование по data science, где успех в первую очередь зависит от качества собранных данных.



🗑Принцип "Garbage in, Garbage out" особенно остро влияет на результат ml-based проекта, когда мусор содержится в целевой переменной. Робастность в этом проекте была ключом к успеху, ведь машинке нужно было уметь выпутываться из сложных ситуаций, когда она сбила фишки или выехала с трека.



💪 Все технические сложности мы успешно преодолели и параллельно собрали качественный датасет, который сделал наше решений максимально робастным. Результат на видео достигнут совместно с @meacca и @anokhin_alexandr.



📹 Очумелые ручки беспилотников: Битва дата саентистов



💬 Какие вы знаете более наглядные примеры работы дата сайентистов для обывателей?