Иллюзия, которая помогает нам учиться



🤔 Вот вы может думаете, что когда ведёшь курс по машинному обучению например, просто берёшь известные темы, рассказываешь их понятно, делаешь задания для закрепления материала и все тут. Как бы ни так.



Знаете, вот иногда выйдешь из дома и думаешь: а я точно дверь закрыл? Ну или там утюг не выключил может. Или для особо тревожных - свет в комнате оставил, теперь за день набежит на целых 50 копеек лишних. Вот есть один такой же тревожный вопрос, который мучает меня про базовый курс машинного обучения, который в разных вариациях и разных местах я преподаю уже 14 лет: порядок тем.



😐 Серьезно. Вот я каждый год несколько раз за год задаюсь вопросами: рассказывать сначала линейные модели или сначала деревья? Рассказать сначала введение во все основные методы supervised learning, а потом unsupervised или сделать нейросети прям отдельно в конце, чтобы сразу там и про всякие автоэнкодеры упомянуть, а не разделять?



🧶 Проблема в том, что наука развивается сама по себе, без оглядки на то, насколько стройная программа курса потом получится :) В итоге получается, что все темы друг с другом взаимосвязаны и расположить их линейно можно кучей способов. В рамках парадигмы «то что мы ещё не проходили, мы с вами пока не знаем» это приводит либо к потере, либо к откладыванию изучения части связей, и роль автора курса - выбрать, что слушателю дать раньше, а о чем рассказать потом или вовсе не рассказывать.



🌳 Ну например, про линейные модели и деревья. Деревья устроены проще в плане нужной для их понимания математики, но, рассказав про деревья, логично не тянуть и сразу переходить к ансамблям деревьев. А хочется сначала пройти какие-то базовые алгоритмы, а потом уже идти в ансамбли. Тогда линейные модели надо ставить до деревьев. Но линейные модели требуют от слушателя уже хоть немного не бояться математики - что такое градиент понимать, градиентный спуск. Если рассказываешь студентам технического ВУЗа - не беда, они все это знают. Если же разрабам или вовсе гуманитариям: создаётся некий барьер, который выше, чем у деревьев, но встретившись раньше, может помешать людям даже добраться до всяких лесов и бустингов, которые на самом деле очень просты. А если просто руками поводить и сказать «ну тут параметры подбираются автоматически из оптимизационной задачи», то будет уже совсем профанация какая-то.



🤹Так вот одна из скрытых (но очень важных) работ любого автора курса - из огромной и разнообразной области, не спрашивающей нас, как ей развиваться, чтобы было красивое оглавление в учебниках, сделать что-то стройное, логичное, систематизированное, уложенное в линейную последовательность тем и дающее слушателю приятную иллюзию порядка.



☝️Как только слушатель начнёт работать и нарабатывать практику, он поймёт, что это была иллюзия. Что нет такого четкого деления на типы алгоритмов, что можно спокойно и безнаказанно совмещать вещи из разных глав учебников, а какие-то методы и задачи можно было записать сразу в несколько глав. Но эта иллюзия порядка, созданная лектором, уже помогла изучить основы. И в этом и был ее смысл.