​​Йоу, бестфитинги



В конце будет крутая штука, пригодится как нубам, так и матёрым волчарам, читаем до конца.



Попросили меня тут прокомментировать курс по features engineering на каггле. Для тех кто не в курсе, там про то, как обрабатывать категориальные переменные, генерить новые фичи и отбирать имеющиеся. Звучит пиздато, да, но курс прежде всего рассчитан на людей, которые совсем незнакомы с features engineering. Именно поэтому подходы, которые там рассматриваются сильно тривиальные и практически любой уважающий себя паблик кернел табличного соревнования уже содержит все эти трюки. Так что, если ты совсем не знаком с FE изучить конечно можно, но такой же результат будет, если сразу сядешь на бутылку и просто начнешь свой путь с публичного кернела. К курсу претензий нет, наоборот, спасибо авторам, что посвящают зеленых в такую тему и делают это так мягко.



Курс → https://www.kaggle.com/learn/feature-engineering



Но нас интересует немного другое, даже самый tupoy уже понял, что features engineering зачастую становится ключом к хорошим результатам соревнований и просто задач классического МЛ. Так какой features engineering, способен реально давать преимущества в соревнованиях? Начнем с того, что мы уже рассматривали несколько подходов, которые работают и проверены временем, их можно найти в закрепе.

А сегодня в программе библиотека, служащая для автоматической генерации фичей. Featuretools — генерация фичей для самых сука ленивых жоп, ну проще уже некуда. Функционал широкий, но разобраться совсем изи, поэтому читаем документацию и используем на здоровье



Либа → https://docs.featuretools.com/en/stable/



Работаем, братва