В этой статье используется недавно представленное преобразование entmax для обучения и выборки из изначально разреженной языковой модели.



https://bit.ly/3g9piIw