«VK Видео» внедрила новые алгоритмы ИИ для автоматического распознавания речи и синтеза субтитров в роликах, шоу, клипах и другом контенте. Об этом сообщает пресс-служба VK.



Отмечается, что точность анализа и расшифровки выросла на 25%, также нейросети теперь знают тысячи новых слов, включая мемы, имена собственные, акронимы и профессиональные термины.



Автоматические субтитры генерируются с помощью Ml-моделей, которые создают текст и расставляют знаки препинания, синхронизируют их с видео. Для повышения точности аудиопоток проходит через несколько этапов обработки. Нейросеть отсеивает сторонние шумы, распознаёт речь и превращает её в текст. После чего подключаются модели пунктуации и денормализации, которые превращают набор распознанных слов в читаемый текст. Далее ИИ синхронизирует получившийся текст с аудиодорожкой. Такой порядок действий позволяет субтитрам быть понятными и удобными как в профессиональных роликах, так и в любительских видео.



🎁OKVpn - лучший VPN