🔤🔤 🔤 🔤🔤 2️⃣🔤
Пошла вторая неделя моего изучения Machine Learning и Deep Learning.
😌 Потихоньку разбираюсь с метриками машинного обучения. В различных случаях использование одной метрики ничего не даёт. Например, accuracy в задаче классификации для дисбаланса классов. Узнал про то, как можно это пофиксить: например, с помощью over sampling и synthetic data
😏 Оказывается, GridSearch для поиска гиперпараметров - не панацея, работает очень медленно, если датасет большой или перебирать надо много. Лучше использовать другие инструменты для тюна (Optuna, например)
😳 Услышал про эмбеддинг товаров, начал копать в эту сторону. Word2vec (King - Man + Woman = Queen)
🤩 Готовлюсь к кейс-чемпионату по DS от Changellenge (заполняем GitHub)
🧐 Посмотрел пару задач на Kaggle, покрутил всеми любимый Titanic. Accuracy = 0.82 для логистической регрессии
🫠 Продолжаю плавиться в Deep Learning School и ИИ старт от МФТИ.
😦 Взял проект на работе по ML с предиктом уходящих пользователей, пока готовлю витрину данных.
В планах:
1️⃣ Установить и разобраться с AirFlow, DAGs
2️⃣ Продолжить ботать матан и линал для ML
3️⃣ Пройти курс по Docker для разворачивания ML-моделей