Моя главная ошибка в изучении data science
В 2013 году я вышел на свою первую работу аналитиком. Это был отдел маркетинга в GE Money Bank.
И там я впервые узнал, что существует data science.
Я услышал, как коллеги обсуждали таинственных людей, создающих какие-то модели и предсказывающих будущее!
Ничего себе, подумал я! Вот это круто!
Excel и SQL, с которыми я работал, стали казаться чем-то крестьянским, для простолюдинов.
И я решил, что хочу предсказывать будущее, а не бесконечные таблиськи делать!
Я начал гуглить и изучать, как же стать дата саентистом, этим жрецом и предсказателем.
И везде я натыкался на то, что надо учить математику. Матан, линейную алгебру, статистику, теорию вероятностей.
Только так можно стать дата саентистом.
***
И я начал учиться. Я стал проходить курсы и читать книги.
И большинство контента, который я нашел, было построено по одному шаблону:
- изучаем основы Python
- изучаем какой-то минимум математики
- пишем с нуля градиентный спуск – это что-то вроде движка под капотом алгоритма машинного обучения
- кратко проходимся по моделям в sklearn (ml библиотека в Python)
Я прошел этот контент, но не почувствовал, что стал дата саентистом.
Я узнал какую-то теорию, какую-то математику, выполнил занимательные эксперименты – как будто батарейку из картошки сделал.
Но к реальному дата саенсу и предсказанию будущего это меня не сильно приблизило.
Я понятия не имел, как это делается в реальной жизни, на реальной работе.
Таинственные дата саентисты так и остались таинственными!
***
И вот в 2016 году я вышел на работу в Альфа-банк, в отдел аналитики и моделирования.
Мне пообещали, что будут не только таблиськи, а что я смогу попробовать и свои новые знания по дата саенсу, хоть я в них был совсем не уверен.
Но самое главное, я увидел настоящих дата саентистов в действии! Пил с ними кофе, ходил на обед, в караоке и даже решал рабочие вопросы.
И каково было мое удивление, когда я обнаружил, что в их работе математики не было вообще!
Оказалось, что для решения прикладных бизнес-задач нужны совсем другие навыки! Никакая не математика!
Что реально нужно:
- проанализировать ситуацию
- подготовить данные
- настроить готовый алгоритм машинного обучения
- по метрикам убедиться, что он будет полезен для конкретной задачи
- мониторить результаты использования
Никакого градиентного спуска, никакой линейной алгебры, теории вероятности и матана!
Да, оно есть там под капотом, но чтобы пользоваться машинным обучением и решать задачи, это знать не нужно!
И я понял, что учил дата саенс задом наперед! Это было моей главной ошибкой!
Кажется логичным начать с основ, и перейти к прикладным задачам. Но это неправильный подход!
Надо сначала научиться пользоваться машинным обучением, и только потом имеет смысл углубляться в математику под капотом.
Если представить, что машинное обучение – это микроволновка, то вместо того, чтобы изучить к ней инструкцию, я учил ядерную физику!
А тебе не нужно знать ядерную физику, чтобы греть еду в микроволновке!
Тебе нужна инструкция, user manual!
После этого осознания у меня всё встало на свои места. Я научился пользоваться моделями машинного обучения и получать бизнес-результаты.
***
В 2018 году я устроился в Сбер уже настоящим дата саентистом и успешно применял эти знания на всех следующих работах.
И к математике я стал относиться спокойнее и учить ее с бóльшим удовольствием.
Математика нужна уже после освоения практических скиллов, чтобы выгодно продать их на рынке труда. И для более глубокого понимания.
***
В 2022 году я создал курс, в которой упаковал весь свой опыт data science и практические навыки по машинному обучению.
Data Science с Глебом Михайловым – это мой самый успешный курс, его уже купило2600+ человек и у него 173 отзыва со средней оценкой 5 ⭐️⭐️⭐️⭐️⭐️ ровно!
Мой курс – это та самая инструкция, которая научит грамотно пользоваться машинным обучением.
Записывайся на мой курс и учи data science правильно!
В 2013 году я вышел на свою первую работу аналитиком. Это был отдел маркетинга в GE Money Bank.
И там я впервые узнал, что существует data science.
Я услышал, как коллеги обсуждали таинственных людей, создающих какие-то модели и предсказывающих будущее!
Ничего себе, подумал я! Вот это круто!
Excel и SQL, с которыми я работал, стали казаться чем-то крестьянским, для простолюдинов.
И я решил, что хочу предсказывать будущее, а не бесконечные таблиськи делать!
Я начал гуглить и изучать, как же стать дата саентистом, этим жрецом и предсказателем.
И везде я натыкался на то, что надо учить математику. Матан, линейную алгебру, статистику, теорию вероятностей.
Только так можно стать дата саентистом.
***
И я начал учиться. Я стал проходить курсы и читать книги.
И большинство контента, который я нашел, было построено по одному шаблону:
- изучаем основы Python
- изучаем какой-то минимум математики
- пишем с нуля градиентный спуск – это что-то вроде движка под капотом алгоритма машинного обучения
- кратко проходимся по моделям в sklearn (ml библиотека в Python)
Я прошел этот контент, но не почувствовал, что стал дата саентистом.
Я узнал какую-то теорию, какую-то математику, выполнил занимательные эксперименты – как будто батарейку из картошки сделал.
Но к реальному дата саенсу и предсказанию будущего это меня не сильно приблизило.
Я понятия не имел, как это делается в реальной жизни, на реальной работе.
Таинственные дата саентисты так и остались таинственными!
***
И вот в 2016 году я вышел на работу в Альфа-банк, в отдел аналитики и моделирования.
Мне пообещали, что будут не только таблиськи, а что я смогу попробовать и свои новые знания по дата саенсу, хоть я в них был совсем не уверен.
Но самое главное, я увидел настоящих дата саентистов в действии! Пил с ними кофе, ходил на обед, в караоке и даже решал рабочие вопросы.
И каково было мое удивление, когда я обнаружил, что в их работе математики не было вообще!
Оказалось, что для решения прикладных бизнес-задач нужны совсем другие навыки! Никакая не математика!
Что реально нужно:
- проанализировать ситуацию
- подготовить данные
- настроить готовый алгоритм машинного обучения
- по метрикам убедиться, что он будет полезен для конкретной задачи
- мониторить результаты использования
Никакого градиентного спуска, никакой линейной алгебры, теории вероятности и матана!
Да, оно есть там под капотом, но чтобы пользоваться машинным обучением и решать задачи, это знать не нужно!
И я понял, что учил дата саенс задом наперед! Это было моей главной ошибкой!
Кажется логичным начать с основ, и перейти к прикладным задачам. Но это неправильный подход!
Надо сначала научиться пользоваться машинным обучением, и только потом имеет смысл углубляться в математику под капотом.
Если представить, что машинное обучение – это микроволновка, то вместо того, чтобы изучить к ней инструкцию, я учил ядерную физику!
А тебе не нужно знать ядерную физику, чтобы греть еду в микроволновке!
Тебе нужна инструкция, user manual!
После этого осознания у меня всё встало на свои места. Я научился пользоваться моделями машинного обучения и получать бизнес-результаты.
***
В 2018 году я устроился в Сбер уже настоящим дата саентистом и успешно применял эти знания на всех следующих работах.
И к математике я стал относиться спокойнее и учить ее с бóльшим удовольствием.
Математика нужна уже после освоения практических скиллов, чтобы выгодно продать их на рынке труда. И для более глубокого понимания.
***
В 2022 году я создал курс, в которой упаковал весь свой опыт data science и практические навыки по машинному обучению.
Data Science с Глебом Михайловым – это мой самый успешный курс, его уже купило
Мой курс – это та самая инструкция, которая научит грамотно пользоваться машинным обучением.
Записывайся на мой курс и учи data science правильно!