Нейросеть научилась подделывать голос человека за 3 секунды.



Компания Microsoft представила VALL-E — алгоритм на основе искусственного интеллекта, который умеет имитировать голос любого человека, прослушав трёхсекундный семпл. 🤔



По заявлению разработчиков, программа способна имитировать даже те эмоции и тон говорящего, примера которых не было в образце. В основе VALL-E — нейросеть, обученная на 60 000 часах разговорной английской речи. К счастью, его исходного кода нет в свободном доступе. 😅