Представьте, что вы хотите начать нормально собирать данные, чистить их, изучать, генерить фичи и обучать модель что-то предсказывать.



8 лет назад я бы просто делал все в jupyter ноутбуках, юзая пандас и условный xgboost, сохраняя датасеты и модели на диск.



Но сейчас мне это кажется сильно устаревшим. Как минимум, я бы развернул MLFlow, чтобы трекать эксперименты. Она еще (вроде) умеет анализировать обученную модель: показывать топ фичей, графики метрик и тп.



Что еще можете посоветовать? Какие ML-продукты вышли за это время, которые позволят тратить минимум времени на разработку и дебаг кода и максимум на дата-рисерч?



Можно и опенсорс селфхостед решения, можно и платные продукты с фри тирами 😉