🔤🔤 🔤 🔤🔤 2️⃣🔤



Пошла вторая неделя моего изучения Machine Learning и Deep Learning.



😌 Потихоньку разбираюсь с метриками машинного обучения. В различных случаях использование одной метрики ничего не даёт. Например, accuracy в задаче классификации для дисбаланса классов. Узнал про то, как можно это пофиксить: например, с помощью over sampling и synthetic data



😏 Оказывается, GridSearch для поиска гиперпараметров - не панацея, работает очень медленно, если датасет большой или перебирать надо много. Лучше использовать другие инструменты для тюна (Optuna, например)



😳 Услышал про эмбеддинг товаров, начал копать в эту сторону. Word2vec (King - Man + Woman = Queen)



🤩 Готовлюсь к кейс-чемпионату по DS от Changellenge (заполняем GitHub)



🧐 Посмотрел пару задач на Kaggle, покрутил всеми любимый Titanic. Accuracy = 0.82 для логистической регрессии



🫠 Продолжаю плавиться в Deep Learning School и ИИ старт от МФТИ.



😦 Взял проект на работе по ML с предиктом уходящих пользователей, пока готовлю витрину данных.



В планах:



1️⃣ Установить и разобраться с AirFlow, DAGs



2️⃣ Продолжить ботать матан и линал для ML



3️⃣ Пройти курс по Docker для разворачивания ML-моделей