Pruning for CNN



Часто обученным сверточным нейросетям нужно не только иметь хорошее качество перед продакшеном, но и соответствовать рамкам по времени инференса и занимаемой памяти. Для решения этой проблемы можно использовать разные классические методы оптимизации, такие как pruning, knowledge distillation, quantization. Их цель — попасть в заданные ограничения и несильно убавить в качестве. Мы познакомимся с pruning и научимся применять его для наших state of the art сетей.



Из этой статьи вы узнаете:

- что такое pruning и как он помогает сжимать нейронные сети

- как применяют pruning на практике при помощи готовых библиотек

- как составить полный пайплайн оптимизации модели, используя pruning для достижения лучших результатов



Читайте нашу новую статью по ссылке: https://deepschool-pro.notion.site/Pruning-for-CNN-e5776c9b167b4ce8af4298a0d4db2497?pvs=4