Китайцы показали свои достижения в области генерации видео-из-текста
Конкурент Sora от Openai — «Vidu» — может создать 16-секундное видео 1080p (заявляется качество уровня Sora, но на данный момент это, конечно, китайское преувеличение - прим. админа).
Возможности Vidu, разработанные китайской фирмой Shengshu Technology и Университетом Цинхуа, заключаются в архитектуре универсального преобразователя зрения (Universal Vision Transformer = U-ViT).
U-ViT объединяет сильные стороны как диффузной, так и модели трансформеров.
Это позволяет создавать очень реалистичные и творческие сцены из простых текстовых запросов.
@Unlim_AI
Конкурент Sora от Openai — «Vidu» — может создать 16-секундное видео 1080p (заявляется качество уровня Sora, но на данный момент это, конечно, китайское преувеличение - прим. админа).
Возможности Vidu, разработанные китайской фирмой Shengshu Technology и Университетом Цинхуа, заключаются в архитектуре универсального преобразователя зрения (Universal Vision Transformer = U-ViT).
U-ViT объединяет сильные стороны как диффузной, так и модели трансформеров.
Это позволяет создавать очень реалистичные и творческие сцены из простых текстовых запросов.
@Unlim_AI