Че как, бродяги
Пора пополнить джентльменский набор мамкиного ДС, если пропустил первую или вторую часть — бан. Так что бегом ознакамливаться.
1. Частенько, обработка пидрильских категориальных признаков в задаче машинного обучения, становится камнем преткновения, если не знать как правильно это делать. Правильная обработка может спасти твою jopu от гнева тимлида или докинуть скора на каггле. В статье собраны основные современные подходы к этому вопросу и наглядно показано, как они работают. Однозначно держим под рукой
Статья → https://towardsdatascience.com/benchmarking-categorical-encoders-9c322bd77ee8
Также, мой юный падаван, не забывай, что современные бустинги типа catboost имеют встроенный функционал обработки категориальных признаков. Достаточно часто, работающий лучше, чем твоя обработка кривыми руками, имей ввиду.
2. Аугментации в задачах с картинками играют важную роль, они помогают модели увидеть больше картинок, не оверфититься и тд. Тут могу порекомендовать либу от отечественного производителя albumentations. С ее помощью будешь манипулировать картинками, так же как твоя бывшая манипулировала тобой, может даже круче. Библиотеку уже давно признало мировое комьюнити, так шо смело юзаем, не стесняемся
Либа → https://github.com/albu/albumentations
Не останавливаемся, братва
Пора пополнить джентльменский набор мамкиного ДС, если пропустил первую или вторую часть — бан. Так что бегом ознакамливаться.
1. Частенько, обработка пидрильских категориальных признаков в задаче машинного обучения, становится камнем преткновения, если не знать как правильно это делать. Правильная обработка может спасти твою jopu от гнева тимлида или докинуть скора на каггле. В статье собраны основные современные подходы к этому вопросу и наглядно показано, как они работают. Однозначно держим под рукой
Статья → https://towardsdatascience.com/benchmarking-categorical-encoders-9c322bd77ee8
Также, мой юный падаван, не забывай, что современные бустинги типа catboost имеют встроенный функционал обработки категориальных признаков. Достаточно часто, работающий лучше, чем твоя обработка кривыми руками, имей ввиду.
2. Аугментации в задачах с картинками играют важную роль, они помогают модели увидеть больше картинок, не оверфититься и тд. Тут могу порекомендовать либу от отечественного производителя albumentations. С ее помощью будешь манипулировать картинками, так же как твоя бывшая манипулировала тобой, может даже круче. Библиотеку уже давно признало мировое комьюнити, так шо смело юзаем, не стесняемся
Либа → https://github.com/albu/albumentations
Не останавливаемся, братва