Представьте, что вы хотите начать нормально собирать данные, чистить их, изучать, генерить фичи и обучать модель что-то предсказывать.
8 лет назад я бы просто делал все в jupyter ноутбуках, юзая пандас и условный xgboost, сохраняя датасеты и модели на диск.
Но сейчас мне это кажется сильно устаревшим. Как минимум, я бы развернул MLFlow, чтобы трекать эксперименты. Она еще (вроде) умеет анализировать обученную модель: показывать топ фичей, графики метрик и тп.
Что еще можете посоветовать? Какие ML-продукты вышли за это время, которые позволят тратить минимум времени на разработку и дебаг кода и максимум на дата-рисерч?
Можно и опенсорс селфхостед решения, можно и платные продукты с фри тирами😉
8 лет назад я бы просто делал все в jupyter ноутбуках, юзая пандас и условный xgboost, сохраняя датасеты и модели на диск.
Но сейчас мне это кажется сильно устаревшим. Как минимум, я бы развернул MLFlow, чтобы трекать эксперименты. Она еще (вроде) умеет анализировать обученную модель: показывать топ фичей, графики метрик и тп.
Что еще можете посоветовать? Какие ML-продукты вышли за это время, которые позволят тратить минимум времени на разработку и дебаг кода и максимум на дата-рисерч?
Можно и опенсорс селфхостед решения, можно и платные продукты с фри тирами