🔺 Transformer models: an introduction and catalog



Что ни день, то новая трансформерная модель. Чтобы не запутаться, можно воспользоваться обзором, который периодически обновляется.



🔸 Для каждой модели есть описание, отражающее её суть. Например, Vicuna — это LLaMA, дообученная на человеческих инструкциях, собранных из ShareGPT.

🔸 Также есть описание основных деталей архитектуры и информация по задачам, на которых модель обучалась (objective).

🔸 У каждой модели есть ссылка на оригинальную статью, если захочется погрузиться в детали.



👉 Читать | Таблица с моделями