Минусы mlcourse.ai

#ml #courses



Mlcourse.ai все еще SotA 🌿, на удивление, за 7-8 лет с момента заложения основ курса в классическом ML поменялось не так многое: регрессии и бустинги еще лет 300 будут актуальны, а питоновский стек жив как никогда (я ожидал, что появится язык, который потеснит питон или хотя бы питоновские ML либы, но еще нет). Более того, как тот дед, читающий собственные книжки, я перед собесами пролистываю материалы млкурса. Bias-variance, бустинг vs. случайный лес, где там в градиентном бустинге градиенты - все это еще очень любят спрашивать (к примеру, Амазон задал мне таких вопросов штук 8 на ML breadth собесах).



При всем этом хочется отметить минусы курса.



1️⃣ Самый существенный минус - структура. Идем от алгоритмов, деревья-линейки-ансамбли. Это интересно, интеллектуально отзывается, здорово погружаться во все усложняющуюся математику, но такой подход приучает к тому, чтоб начинать с решения. Тогда как начинать надо с проблемы. В целом видна академическая родословная курса: он вырос из моей TA активности в аспирантуре. Вот так, начиная с решений, мы приходим к громоздким решениям, порой и не решающим ни одной проблемы (к слову о стартапах): можно периодически заходить на ProductHunt и скроллить, задаваясь вопросом: «ребят, а какую проблему вы решаете?».



Сейчас я бы структурировал курс по-другому, исходя из проблем, а не ML-алгоритмов. Тут описывал, как именно, если кто видел подобный курс, подскажите. Я бы даже добавил модуль 0: коллекцию кейсов, когда ML оказывался не нужен, ведь именно no-ML отличает настоящих спецов.



2️⃣ Английский. Будем честны, по уровню английского курс проигрывает аналогам. Все же он создавался на русском, потом флотом из 25-30 волонтеров переводился, дальше вычитывался полупрофом из Стэнфорда, но до проф-уровня не дотянул. Местами видны кальки с русского и довольно кучерявые обороты.



3️⃣ Дисперсия качества. Поскольку курс писался разными людьми, немного плавают обозначения и стиль повествования. Если писать книгу, то это надо было бы все унифицировать. Что более существенно, при том что некоторые главы курса прям очень хороши, другие проседают и выше уровня документации sklearn их не поставишь.



4️⃣ Качество видео. Что и говорить, именно по видео заметно, что курс создавался почти без бюджета, на энтузиазме. Статьи топ, и сам я предпочитаю текстовый вариант. Но как видео набрали в сумме свой лям просмотров - удивительно. Все же недаром курсера навязала формат с короткими фрагментами по 5-7 минут видео: так эффективнее. Смотреть на говорящую голову и дрожащий курсор два часа подряд - это прям хардкор. Хотя на это можно и по-другому посмотреть: остаются самые мотивированные, которых увлек именно контент, а не формат.



Пс. Думаю, перечисление минусов курса не помешает поставить звездочек репе курса, авось и до 10к дотянем, тогда для приличия текущие ищьюс закрою. А заодно расскажу, как мне все же карьерно помогли эти тысячи часов, потраченные на бесплатный курс.