#lingtrain #books #nlp #tools
📚 DIY книги
Научился делать вот такие параллельные книги из двух текстовых файлов.
Сначала идет процесс выравнивания при помощи модельки, которая оценивает близость предложений по смыслу. Затем разрешаются конфликты (количество предложений между оригиналом и переводом могут отличаться существенно).
Потом немного магии с генерацией PDF'а. Ну а обложку генерирую при помощи диффузионных моделей.
✔️ Весь код выложил, инструкцию написал. Так что не стесняйтесь, делайте книги, изучайте языки.
GitHub, Статья
📚 DIY книги
Научился делать вот такие параллельные книги из двух текстовых файлов.
Сначала идет процесс выравнивания при помощи модельки, которая оценивает близость предложений по смыслу. Затем разрешаются конфликты (количество предложений между оригиналом и переводом могут отличаться существенно).
Потом немного магии с генерацией PDF'а. Ну а обложку генерирую при помощи диффузионных моделей.
✔️ Весь код выложил, инструкцию написал. Так что не стесняйтесь, делайте книги, изучайте языки.
GitHub, Статья