xFasterTransformer — содержит набор инструментов от Intel для ускорения больших языковых моделей с использованием аппаратных возможностей Intel.



Он оптимизирует производительность LLM, таких как GPT и BERT, на архитектурах Intel.



Основная цель — увеличить производительность моделей и сократить время выполнения операций в реальном времени



Ссылка: тык



👉 @Cpportal | #ресурсы