Разработчики из Массачусетского технологического института (MIT) создали нейронную сеть, которая может воссоздать лицо человека по спектрограмме его речи.



Исследователи обучили алгоритм на нескольких миллионах роликов из интернета. Одна часть нейросети анализировала видеоряд, а другая преобразовывала звук в спектрограмму. Затем программа использовала все эти данные, чтобы воссоздать облик человека.



Нейросеть очень точно определяет пол и расу, но не возраст. Впрочем, исследователи всеми силами пытаются улучшить модель. Похоже, скоро отыскать человека, который угрожал вам по телефону, будет гораздо проще, чем сейчас.



https://speech2face.github.io



#новости_Код