πŸ’» Russian Texts Statistics (ruts)



πŸ‘‰ Π‘ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠ° разработанная для извлСчСния ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠΎΠ² ΠΈΠ· ΠΏΡ€ΠΎΠΈΠ·Π²ΠΎΠ»ΡŒΠ½ΠΎΠ³ΠΎ тСкста. Π Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ Π½Π° русском, Π½ΠΎ Π½ΠΈΡ‡Π΅Π³ΠΎ Π½Π΅ ΠΌΠ΅ΡˆΠ°Π΅Ρ‚ ΠΏΡ€ΠΈΠΌΠ΅Π½ΠΈΡ‚ΡŒ для Π΄Ρ€ΡƒΠ³ΠΎΠ³ΠΎ языка.



Π’ ΠΊΠΎΠΌΠΏΠ»Π΅ΠΊΡ‚ входят:

β€’ Π‘Π°Π·ΠΎΠ²Ρ‹Π΅ статистики (количСство слогов, Π±ΡƒΠΊΠ², ΠΏΡ€ΠΎΠ±Π΅Π»ΠΎΠ² ΠΈ Ρ‚Π΄)

β€’ ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ удобочитаСмости (ΡƒΠΆΠ΅ писал ΠΎ Π½ΠΈΡ…)

β€’ ΠœΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ лСксичСского разнообразия (ИндСкс Бимпсона ΠΈ Ρ‚Π΄)

β€’ ΠœΠΎΡ€Ρ„ΠΎΠ»ΠΎΠ³ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ статистики



Π’ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠΈ:

β€” Π—Π°ΠΊΠΎΠ½ Π¦ΠΈΠΏΡ„Π°

β€” ЛитСратурная дактилоскопия

β€” Π”Π΅Ρ€Π΅Π²ΠΎ слов



ΠŸΠΎΠ΄ΠΎΠΉΠ΄Π΅Ρ‚ Π² качСствС экстрактора для Ρ„ΠΈΡ‡Π° ΠΈΠ½ΠΆΠΈΠ½ΠΈΡ€ΠΈΠ½Π³Π° ΠΊ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎΠΌΡƒ tf-idf ΠΈΠ»ΠΈ эмбСддингам.



github