Китайцы показали свои достижения в области генерации видео-из-текста



Конкурент Sora от Openai — «Vidu» — может создать 16-секундное видео 1080p (заявляется качество уровня Sora, но на данный момент это, конечно, китайское преувеличение - прим. админа).



Возможности Vidu, разработанные китайской фирмой Shengshu Technology и Университетом Цинхуа, заключаются в архитектуре универсального преобразователя зрения (Universal Vision Transformer = U-ViT).



U-ViT объединяет сильные стороны как диффузной, так и модели трансформеров.



Это позволяет создавать очень реалистичные и творческие сцены из простых текстовых запросов.



@Unlim_AI