🔺 Woland-10



Сделал параллельный корпус на 10 языков (ru, be, uk, en, de, it, fr, es, hu, zh) из различных редакций романа Мастер и Маргарита. Всего получилось ~7.5k параллельных групп строк.



〰️ Выровнял при помощи своей выравнивалки Lingtrain (а это, напомню, проект открытый). Получилось довольно быстро, особенно с новой картой, — со своей GPU жизнь действительно заиграла новыми красками 😁



Сначала нашел и разметил 10 текстов на разных языках, потом выровнял каждую пару с оригиналом. Потом все выравнивания совместно. Могу описать подробней, если интересно.



Могут встречаться шероховатости, так как все равно надо дополнительно проверять качество, но в целом выглядит пристойно (если что — пишите), буду ещё улучшать.



🇷🇺 Вино какой страны предпочитаете в это время дня?

🇧🇾 Вiно з якое краiны вы любiце ў гэтую пару дня?

🇺🇦 Вино якої країни вам більше до вподоби цієї пори дня?

🇬🇧 What country's wine do you prefer at this time of day?'

🇩🇪 Den Wein welches Landes bevorzugen Sie zu dieser Tageszeit?"

🇫🇷 Du vin de quel pays préférez-vous, à cette heure de la journée ?

🇮🇹 Il vino di quale paese preferisce a quest'ora del giorno?

🇪🇸 ¿De qué país lo prefiere a esta hora del día?

🇭🇺 Milyen bort szeret a legjobban ilyenkor déltájban?

🇨🇳 平常在这个时间您喜欢喝哪国产的葡萄酒?





👉 GitHub



@doomgrad