MARS5



Это инновационная модель синтеза речи, способная к клонированию голоса из 5 секунд аудио и фрагмента текста.



Система позволяет точно настраивать речь с помощью пунктуации и заглавных букв в тексте и поддерживает указание идентичности говорящего через эталонный аудиофайл.



MARS5 можно загрузить через Docker, или же использовать с Hugging Face



⭐️ Stars: 2.4k



➡️ Cсылка на GitHub



📱 @git_developer