Нейроскептик

Год только начался, а уже появилась нейросеть по мгновенному клонированию голоса

OpenVoice требуется всего лишь короткого аудиоклипа от эталонного голоса, чтобы воспроизвести его и генерировать речь на нескольких языках.

Нейросеть обеспечивает детальный контроль над стилями голоса, включая эмоции, акцент, ритм, паузы и интонацию, а также воспроизводит тона эталонного голоса. OpenVoice также обеспечивает межъязыковое клонирование речи для языков, не включенных в обучающий набор с большим количеством говорящих.

Подписаться на Нейроскептик