#articles



1000 языков от Google



Горячая статья от Google про машинный перевод на тысячу языков. Описывают свои наработки по этой теме. Ничем пока что не делятся, но есть любопытные наблюдения.



• Period trick. Во время тестирования модели обнаружили, что качество для многих пар языков деградирует, если в input не оканчивается точкой. А иногда из-за этого даже переводит не на тот язык.

• Так же как и в статье от Meta обращают внимание на то, что есть много языков с несколькими видами письменности. Сделали отдельные модели по "переводу" (транслитерации) одного письма в другое.

• Поисследовали как ведет себя модель, если заменить буквы их unicode-близнецами (например "I" и палочка).



🖖 Пожелаем удачи исследователям и будем следить за новостями!



Статья