ModelScope Text-2-Video: Китайский опенсоурс разродился открытой моделькой для генерации видео по тексту



Это первая диффузионная text2video модель с открытым кодом и опуьликованными весами (1.7 млрд параметров).



Отдельный респект идет Шаттерстоку, данные с которого по всей видимотси использовались для тренировки модели 😂.



Чтобы запустить локально потребуется 16 GB RAM и 16 GB VRAM: инструкция. Пока генерит видео только 256x256.



Ну что, давайте побыстрее заполним интернет проклятыми видео!



Demo

Model weights