Nvidia представила свою нейросеть с генерацией видео по текстовому описанию. 🎮



Компания показала возможности технологии VideoLDM в рамках конференции IEEE по компьютерному зрению и распознаванию образов.

Усовершенствованная нейросеть NVIDIA позволяет создавать ролики продолжительностью около пяти секунд в разрешении до 2048х1280 пикселей и с частотой 24 fps. Алгоритмы генерируют видео на основе как простых текстовых запросов вроде «собака плывёт», так и на базе более сложных, например, «медведь в лесу играет на пианино, пригласив группу лесных зверей подпевать».

Нейросеть NVIDIA пока недоступна в открытом доступе.



🤖 ChatGPT | Технологии & IT