💬 Meta представила семейство языковых ИИ-моделей Massively Multilingual Speech (MMS). Исходный код проекта доступен на GitHub.



MMS могут идентифицировать более 4000 разговорных языков, что в 40 раз превышает возможности существующих аналогов. Также алгоритмы научили синтезировать речь и преобразовывать ее в текст на около 1100 диалектах.



Для обучения моделей разработчики использовали Новый Завет, на основе которого создали два датасета. Первый содержит аудио и текст на 1107 языках. Второй включает немаркированные записи речи на 3809 диалектах.



☝️ В компании предупредили, что иногда MMS способны неправильно расшифровать определенные слова и фразы. Также в Библии много предвзятости и искажений, добавили в Meta.



———

Новости в области искусственного интеллекта - @GPTMainNews