🔺 Корпуса малоресурсных языков



Айгиз Кунафин выложил на huggingface 🤗 русско-башкирский (700k пар) и русско-марийский (350k) параллельные корпуса.



Корпуса собирались и собираются группами энтузиастов в течение долгого времени, ребята любят и продвигают свой родной язык.



Молодцы, ждём чувашей и коми.



👉 Upd. Чувашский корпус есть.