факторизация внимания в Sparced Transformer