πŸ“Ή ΠšΠΎΠ½ΠΊΡƒΡ€Π΅Π½Ρ‚ Sora ΠΈΠ· ΠšΠΈΡ‚Π°Ρ - Vidu



ΠšΠΈΡ‚Π°ΠΉΡΠΊΠ°Ρ ΠΊΠΎΠΌΠ°Π½Π΄Π° ΠΈΠ· ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ ShengShu-AI ΠΈ унивСрситСта Π¦ΠΈΠ½Ρ…ΡƒΠ° прСдставила ΠΏΠ΅Ρ€Π²ΡƒΡŽ модСль text-to-video ΠΏΠΎΠ΄ Π½Π°Π·Π²Π°Π½ΠΈΠ΅ΠΌ Vidu. По заявлСниям Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΎΠ², Vidu Π½Π΅ уступаСт Π½Π°ΡˆΡƒΠΌΠ΅Π²ΡˆΠ΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ Sora ΠΎΡ‚ OpenAI.



πŸŽ₯ Vidu способна Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ 16-сСкундныС Π²ΠΈΠ΄Π΅ΠΎΠΊΠ»ΠΈΠΏΡ‹ Π² Ρ€Π°Π·Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΈ 1080p. Π’ основС ΠΌΠΎΠ΄Π΅Π»ΠΈ Π»Π΅ΠΆΠΈΡ‚ ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΠΎ разработанная Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Π° U-ViT (Universal Vision Transformer), которая ΠΎΠ±ΡŠΠ΅Π΄ΠΈΠ½ΡΠ΅Ρ‚ Π² сСбС Π΄Π²Π΅ ΠΌΠΎΠ΄Π΅Π»ΠΈ text-to-video: Diffusion ΠΈ Transformer.



ΠšΠ»ΡŽΡ‡Π΅Π²Π°Ρ тСхнология U-ViT Π±Ρ‹Π»Π° Π²ΠΏΠ΅Ρ€Π²Ρ‹Π΅ ΠΏΡ€Π΅Π΄Π»ΠΎΠΆΠ΅Π½Π° ΠΈΡΡΠ»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΡΠΊΠΎΠΉ ΠΊΠΎΠΌΠ°Π½Π΄ΠΎΠΉ Vidu Π΅Ρ‰Π΅ Π² сСнтябрС 2022 Π³ΠΎΠ΄Π°, ΠΎΠΏΠ΅Ρ€Π΅Π΄ΠΈΠ² Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρƒ DiT (Diversity in Transformation) ΠΎΡ‚ Sora. U-ViT считаСтся ΠΏΠ΅Ρ€Π²ΠΎΠΉ Π² ΠΌΠΈΡ€Π΅ Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€ΠΎΠΉ прСобразования Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ, ΡΠΎΡ‡Π΅Ρ‚Π°ΡŽΡ‰Π΅ΠΉ прСимущСства ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Diffusion ΠΈ Transformer.



Vidu ΡƒΠΌΠ΅Π΅Ρ‚ рСалистично ΡΠΈΠΌΡƒΠ»ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ физичСский ΠΌΠΈΡ€ ΠΈ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ сцСны со слоТными дСталями, ΠΏΠΎΠ΄Ρ‡ΠΈΠ½ΡΡŽΡ‰ΠΈΠΌΠΈΡΡ Π·Π°ΠΊΠΎΠ½Π°ΠΌ Ρ„ΠΈΠ·ΠΈΠΊΠΈ, Ρ‚Π°ΠΊΠΈΠΌΠΈ ΠΊΠ°ΠΊ ΠΏΡ€Π°Π²Π΄ΠΎΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹Π΅ эффСкты свСта ΠΈ Ρ‚Π΅Π½ΠΈ, Π° Ρ‚Π°ΠΊΠΆΠ΅ Ρ‚ΠΎΠ½ΠΊΠΈΠ΅ мимичСскиС выраТСния. МодСль способна ΡΠΎΠ·Π΄Π°Π²Π°Ρ‚ΡŒ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ статичныС, Π½ΠΎ ΠΈ Π΄ΠΈΠ½Π°ΠΌΠΈΡ‡Π½Ρ‹Π΅ ΠΊΠ°Π΄Ρ€Ρ‹ со слоТной ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ†ΠΈΠ΅ΠΉ.



🐼 Π‘ΡƒΠ΄ΡƒΡ‡ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Π°Π½Π½ΠΎΠΉ Π² ΠšΠΈΡ‚Π°Π΅, Vidu ΠΎΡ‚Π»ΠΈΡ‡Π½ΠΎ ΠΏΠΎΠ½ΠΈΠΌΠ°Π΅Ρ‚ ΠΊΠΈΡ‚Π°ΠΉΡΠΊΡƒΡŽ спСцифику ΠΈ ΠΌΠΎΠΆΠ΅Ρ‚ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ изобраТСния ΡƒΠ½ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹Ρ… китайских пСрсонаТСй, Ρ‚Π°ΠΊΠΈΡ… ΠΊΠ°ΠΊ ΠΏΠ°Π½Π΄Π° ΠΈ Π»ΡƒΠ½ (китайский Π΄Ρ€Π°ΠΊΠΎΠ½).