Эта последняя я обещаю, но тут авторы еще размеры матриц указывают и все еще понятней



https://lionbridge.ai/articles/what-are-transformer-models-in-machine-learning/