Bias-variance tradeoff: Спрашивают на каждом собесе, применяют в реальности единицы



Без технических подробностей и некоторых допущений, ошибка модели раскладывается так:



Ошибка = Bias^2 + Variance + sigma^2



Bias - как точно мы попадаем в среднем в истину



Variance - Как сильно колеблется наша предсказания функция относительно истинной



Sigma^2 - Неснижаемая дисперсия данных



И мы можем за счёт регуляризации снижать Variance за счёт роста Bias, и наоборот. Прекрасная теоретическая выкладка, но что с этим в реальности-то делать? 🤔



Давайте сначала посмотрим на простом примере, какая тут ситуация с Bias и Variance





UPD: Ценителям очень точных определений лучше посмотреть на них по ссылке в посте:) Текстом я писал определения с некоторыми допущениями для более широкой аудитории