ТГХаб
Каналы
Mashkka про Data Science
📍
В своем
посте
на хабр
DoomGrad
рассказывает про то, как создавался
Woland-10
- параллельный корпус на 10 языках.
Для его создания использовался
Lingtrain
- классная тулза по выравниванию текстов на разных языках.