Whisper Speech и Dreamtalk - это две нейронные сети, которые вместе могут оживить любое изображение. Первая использует аудио для копирования голоса и озвучивания текста, а затем вторая анимирует изображение, подстраивая мимику под озвучку. Результат на видео.
2 нейронки в 1 месте, разовая акция