#nlp #parallelcorpora
Два перевода
📚 Выровнял два перевода рассказа Бредбери "The Picasso Summer" на русский. Первый от Норы Галь, второй от Арама Оганяна.
Можно видеть, что переводчик — птица вольная, особенно по части имён, хотя оба перевода хорошие.
💡 Так же видно, что это по сути корпус парафраз, который можно использовать для различных целей машинного обучения.
В следующей версии Lingtrain Aligner, язык станет зависим от стороны выравнивания (левая/правая), чтобы выравнивать два текста на одном языке. Пока что я загружал один текст как русский, а второй как general язык.
Два перевода
📚 Выровнял два перевода рассказа Бредбери "The Picasso Summer" на русский. Первый от Норы Галь, второй от Арама Оганяна.
Можно видеть, что переводчик — птица вольная, особенно по части имён, хотя оба перевода хорошие.
💡 Так же видно, что это по сути корпус парафраз, который можно использовать для различных целей машинного обучения.
В следующей версии Lingtrain Aligner, язык станет зависим от стороны выравнивания (левая/правая), чтобы выравнивать два текста на одном языке. Пока что я загружал один текст как русский, а второй как general язык.