#technology

Компания Stability AI представила бесплатную модель для создания изображений — Stable Diffusion 3.5 Large



Ключевым изменением стал переход на архитектуру MMDiT (Multimodal Diffusion Transformer) с тремя специализированными текстовыми энкодерами:



■ OpenCLIP-ViT/G для понимания общего контекста и стилей;



■ CLIP-ViT/L для детального анализа визуальных элементов;



■ T5-XXL для обработки сложных текстовых описаний и пространственных отношений.



Stable Diffusion 3.5 Large станет флагманом компании с 8 миллиардами параметров, способный работать с разрешением до 1 мегапикселя. Помимо него есть также версия Large Turbo, для тех кому критична скорость создания изображения, и версия Stable Diffusion 3.5 Medium, релиз которой ожидается в конце октября, она предложит более облегченную версию с 2.5 миллиардами параметрами, оптимизированными для работы на обычных компьютерах.



Наука и Бизнес