В тему синтеза речи — вот любопытный и перспективный проект.



Называется VALL-E-X. Модель умеет синтезировать голос на основе совсем крохотных входных данных. Достаточно буквально нескольких секунд.



#voiceCover