Моя главная ошибка в изучении data science



В 2013 году я вышел на свою первую работу аналитиком. Это был отдел маркетинга в GE Money Bank.



И там я впервые узнал, что существует data science.



Я услышал, как коллеги обсуждали таинственных людей, создающих какие-то модели и предсказывающих будущее!



Ничего себе, подумал я! Вот это круто!



Excel и SQL, с которыми я работал, стали казаться чем-то крестьянским, для простолюдинов.



И я решил, что хочу предсказывать будущее, а не бесконечные таблиськи делать!



Я начал гуглить и изучать, как же стать дата саентистом, этим жрецом и предсказателем.



И везде я натыкался на то, что надо учить математику. Матан, линейную алгебру, статистику, теорию вероятностей.



Только так можно стать дата саентистом.



***



И я начал учиться. Я стал проходить курсы и читать книги.



И большинство контента, который я нашел, было построено по одному шаблону:



- изучаем основы Python

- изучаем какой-то минимум математики

- пишем с нуля градиентный спуск – это что-то вроде движка под капотом алгоритма машинного обучения

- кратко проходимся по моделям в sklearn (ml библиотека в Python)



Я прошел этот контент, но не почувствовал, что стал дата саентистом.



Я узнал какую-то теорию, какую-то математику, выполнил занимательные эксперименты – как будто батарейку из картошки сделал.



Но к реальному дата саенсу и предсказанию будущего это меня не сильно приблизило.



Я понятия не имел, как это делается в реальной жизни, на реальной работе.



Таинственные дата саентисты так и остались таинственными!



***



И вот в 2016 году я вышел на работу в Альфа-банк, в отдел аналитики и моделирования.



Мне пообещали, что будут не только таблиськи, а что я смогу попробовать и свои новые знания по дата саенсу, хоть я в них был совсем не уверен.



Но самое главное, я увидел настоящих дата саентистов в действии! Пил с ними кофе, ходил на обед, в караоке и даже решал рабочие вопросы.



И каково было мое удивление, когда я обнаружил, что в их работе математики не было вообще!



Оказалось, что для решения прикладных бизнес-задач нужны совсем другие навыки! Никакая не математика!



Что реально нужно:



- проанализировать ситуацию

- подготовить данные

- настроить готовый алгоритм машинного обучения

- по метрикам убедиться, что он будет полезен для конкретной задачи

- мониторить результаты использования



Никакого градиентного спуска, никакой линейной алгебры, теории вероятности и матана!



Да, оно есть там под капотом, но чтобы пользоваться машинным обучением и решать задачи, это знать не нужно!



И я понял, что учил дата саенс задом наперед! Это было моей главной ошибкой!



Кажется логичным начать с основ, и перейти к прикладным задачам. Но это неправильный подход!



Надо сначала научиться пользоваться машинным обучением, и только потом имеет смысл углубляться в математику под капотом.



Если представить, что машинное обучение – это микроволновка, то вместо того, чтобы изучить к ней инструкцию, я учил ядерную физику!



А тебе не нужно знать ядерную физику, чтобы греть еду в микроволновке!



Тебе нужна инструкция, user manual!



После этого осознания у меня всё встало на свои места. Я научился пользоваться моделями машинного обучения и получать бизнес-результаты.



***



В 2018 году я устроился в Сбер уже настоящим дата саентистом и успешно применял эти знания на всех следующих работах.



И к математике я стал относиться спокойнее и учить ее с бóльшим удовольствием.



Математика нужна уже после освоения практических скиллов, чтобы выгодно продать их на рынке труда. И для более глубокого понимания.



***



В 2022 году я создал курс, в которой упаковал весь свой опыт data science и практические навыки по машинному обучению.



Data Science с Глебом Михайловым – это мой самый успешный курс, его уже купило 2600+ человек и у него 173 отзыва со средней оценкой 5 ⭐️⭐️⭐️⭐️⭐️ ровно!



Мой курс – это та самая инструкция, которая научит грамотно пользоваться машинным обучением.



Записывайся на мой курс и учи data science правильно!