🤖 Вышла WAN 2.1 - это очень качественная модель для генерации видео.



🔹Разработчик китайская компания Alibaba.



👌ComfyUI поддерживает модель Wan2.1 нативно, достаточно обновить ComfyUI и дополнительно узлы для работы с этой моделью устанавливать не придётся.



💤На данный момент существует 4 модели Wan 2.1:

- Text to video 1.3B, которая поддерживает 480P

- Text to video 14B, которая поддерживает 480P и 720P

- Image to video 14B 720P

- Image to video 14B 480P



🦾Сколько видео памяти потребуется для работы с этими моделями:

- Модель 1.3B потребует чуть больше 8 Гб VRAM, но это откровенно очень слабая модель.

- Любая другая модель 14B потребует 20Гб в формате fp8 и 16Гб в формате GGUF Q4.



🚀Скорость генераций модели 480p, 14B на rtx4090:

- 2 секундное видео, 33 кадра генерируется 80  сек

- 5 секундное видео, 81 кадр генерируется 250  сек.



💫Модель 720p выдает более детализированное виде, но скорость генерации в 2 раза дольше и максимально возможное кол-во кадров 53 на 24 Гб VRAM.



🤹‍♂️Модель wan 2.1 генерирует на любой 14B модели консистентное видео благодаря технологии основанной на трехмерной пространственной связи и производительности для модели такого уровня очень хорошая. Модель способна генерировать текст как на китайском, так и на английском языке.



🐣Потенциал модели высокий. Модель способна: txt2video, img2video, text2image, редактированием видео и video2audio.



🌐Онлайн сервис для генераций T2V и T2I: ССЫЛКА



💺МОДЕЛИ:

- wan_2.1_vae (models/vae): ССЫЛКА

- clip_vision_h (models/clip_vision): ССЫЛКА

- umt5 (models/text_encoders): ССЫЛКА



WAN 2.1

(models/diffusion_models)

- I2V-14B-480p-fp8

- I2V-14B-720p-fp8

- I2V-14B-480p-gguf

- T2V-14B-fp8

- T2V-1.3-fp8



🌀В комментариях добавлю 4 схемы: T2V, I2V-480p, I2V-720p, I2V-480p-GGUF



💡Страница разработчика: ССЫЛКА



⚡️ СХЕМЫ ТУТ