🗣 В Facebook разработали модель распознавания речи Wav2vec-U, которая не требует каких-либо аннотированных наборов данных.
Компания уже протестировала ее на суахили, киргизском и крымскотатарском языках, для которых отсутствуют качественные датасеты. По словам разработчиков, система выдает на 63% меньше ошибок, чем ее лучший неконтролируемый метод. Они добавили, что инструмент так же точен, как и контролируемые системы несколько лет назад.
🌍 В Facebook считают, что их открытие может привести к появлению систем распознавания речи для большего количества языков и диалектов по всему миру. Для ускорения развития инструмента, разработчики разместили исходный код Wav2vec-U на GitHub.
#Facebook #NLP
Компания уже протестировала ее на суахили, киргизском и крымскотатарском языках, для которых отсутствуют качественные датасеты. По словам разработчиков, система выдает на 63% меньше ошибок, чем ее лучший неконтролируемый метод. Они добавили, что инструмент так же точен, как и контролируемые системы несколько лет назад.
🌍 В Facebook считают, что их открытие может привести к появлению систем распознавания речи для большего количества языков и диалектов по всему миру. Для ускорения развития инструмента, разработчики разместили исходный код Wav2vec-U на GitHub.
#Facebook #NLP