#nlp #parallelcorpora



Два перевода



📚 Выровнял два перевода рассказа Бредбери "The Picasso Summer" на русский. Первый от Норы Галь, второй от Арама Оганяна.



Можно видеть, что переводчик — птица вольная, особенно по части имён, хотя оба перевода хорошие.



💡 Так же видно, что это по сути корпус парафраз, который можно использовать для различных целей машинного обучения.



В следующей версии Lingtrain Aligner, язык станет зависим от стороны выравнивания (левая/правая), чтобы выравнивать два текста на одном языке. Пока что я загружал один текст как русский, а второй как general язык.