
"ВКонтакте" представила новую функцию расшифровки видеосообщений, которая доступна в "VK Мессенджере". Теперь пользователи могут получать текстовую версию видеообращений. Это достигается благодаря технологии ASR, разработанной внутри социальной сети.
Алгоритм работы функции включает три нейросети. Акустическая нейросеть распознает звуки из видео, языковая нейросеть формирует слова на основе звуков, а пунктуационная нейросеть определяет границы предложений и ставит знаки препинания. В результате получается точный текст видеосообщений.
@innovation_station
Алгоритм работы функции включает три нейросети. Акустическая нейросеть распознает звуки из видео, языковая нейросеть формирует слова на основе звуков, а пунктуационная нейросеть определяет границы предложений и ставит знаки препинания. В результате получается точный текст видеосообщений.
@innovation_station