Синтез голоса выходит на новый уровень: Google представил SoundStorm . Это новая модель, которая генерирует сверхреалистичный разговор из текста.



Кроме того, модель очень быстро генерирует речь — 30 секунд речи всего за полсекунды.