Ребята постарались — с нуля собрали датасет и познакомили нейросеть с тысячами иероглифов. Очень впечатляет, что нейросети даже научились различать четыре тона человеческого голоса — они в китайском определяют смысл сказанного.
На YouTube уже доступна автоматическая русская озвучка, нужно нажать на кнопку «Перевести видео». А скоро появится на популярной в Китае платформе Bilibili.