🗣 В Facebook разработали модель распознавания речи Wav2vec-U, которая не требует каких-либо аннотированных наборов данных.



Компания уже протестировала ее на суахили, киргизском и крымскотатарском языках, для которых отсутствуют качественные датасеты. По словам разработчиков, система выдает на 63% меньше ошибок, чем ее лучший неконтролируемый метод. Они добавили, что инструмент так же точен, как и контролируемые системы несколько лет назад.



🌍 В Facebook считают, что их открытие может привести к появлению систем распознавания речи для большего количества языков и диалектов по всему миру. Для ускорения развития инструмента, разработчики разместили исходный код Wav2vec-U на GitHub.



#Facebook #NLP