Год только начался, а уже появилась нейросеть по мгновенному клонированию голоса



OpenVoice требуется всего лишь короткого аудиоклипа от эталонного голоса, чтобы воспроизвести его и генерировать речь на нескольких языках.



Нейросеть обеспечивает детальный контроль над стилями голоса, включая эмоции, акцент, ритм, паузы и интонацию, а также воспроизводит тона эталонного голоса. OpenVoice также обеспечивает межъязыковое клонирование речи для языков, не включенных в обучающий набор с большим количеством говорящих.



Подписаться на Нейроскептик