
Google представила Translatotron — первую модель перевода, которая может напрямую конвертировать речь с одного языка на другой. При этом она умеет сохранять некоторые особенности голоса говорящего.
Обычно системы перевода конвертируют речь в текст, который затем снова превращают в речь, но уже на другом языке. Из-за этого в тексте появляются ошибки. Translatotron, в свою очередь, создаёт из голоса спектрограмму — то есть визуализирует частоты — и генерирует другую спектрограмму на целевом языке. В результате получается гораздо более быстрый и точный перевод.
Пока технология находится в зачаточном состоянии. Переведённая речь звучит не слишком естественно, но всё же гораздо лучше, чем раньше. Ждём, когда Google усовершенствует систему и внедрит её в свои сервисы. И всё — в иняз можно не поступать.
Примеры: https://google-research.github.io/lingvo-lab/translatotron/
Обычно системы перевода конвертируют речь в текст, который затем снова превращают в речь, но уже на другом языке. Из-за этого в тексте появляются ошибки. Translatotron, в свою очередь, создаёт из голоса спектрограмму — то есть визуализирует частоты — и генерирует другую спектрограмму на целевом языке. В результате получается гораздо более быстрый и точный перевод.
Пока технология находится в зачаточном состоянии. Переведённая речь звучит не слишком естественно, но всё же гораздо лучше, чем раньше. Ждём, когда Google усовершенствует систему и внедрит её в свои сервисы. И всё — в иняз можно не поступать.
Примеры: https://google-research.github.io/lingvo-lab/translatotron/