Генерация видосов добралась до телефонов — разрабы из Snap Inc. показали генерацию видео на iPhone 16 Pro Max. Для создания 5-секундного ролика уходит всего... пять секунд, так что для небольших гифок сгодится.



• В основе — сильно оптимизированные Stable Diffusion 1.5 и VAE декодер из Open-Sora

• Прирост скорости впечатляет: 10x для SD и целых 50x для декодера

• Модели старые и далеки от SOTA, но интересно, как такой прунинг зайдёт на современных видео-моделях вроде Hunyuan



Того гляди, скоро каждый школьник будет клепать дипфейки прямо на переменке.



Пет-проект