Сжатие моделей через прунинг параметров и квантизацию помогает облегчить нейросети для использования в слабых девайсах вроде смартфонов, колонок и разных там wearables при минимальных потерях в точности работы. Однако, новый рисерч показывает, что такие техники могут усиливать изначальные искажения в данных (bias), и, не сильно понижая общую точность, особо негативно влиять на недопредставленные классы и другие проблемные экземпляры. Учитывайте это, когда будете проверять свою сжатую модель☝️