
#technology
Компания Stability AI представила бесплатную модель для создания изображений — Stable Diffusion 3.5 Large
Ключевым изменением стал переход на архитектуру MMDiT (Multimodal Diffusion Transformer) с тремя специализированными текстовыми энкодерами:
■ OpenCLIP-ViT/G для понимания общего контекста и стилей;
■ CLIP-ViT/L для детального анализа визуальных элементов;
■ T5-XXL для обработки сложных текстовых описаний и пространственных отношений.
Stable Diffusion 3.5 Large станет флагманом компании с 8 миллиардами параметров, способный работать с разрешением до 1 мегапикселя. Помимо него есть также версия Large Turbo, для тех кому критична скорость создания изображения, и версия Stable Diffusion 3.5 Medium, релиз которой ожидается в конце октября, она предложит более облегченную версию с 2.5 миллиардами параметрами, оптимизированными для работы на обычных компьютерах.
Наука и Бизнес
Компания Stability AI представила бесплатную модель для создания изображений — Stable Diffusion 3.5 Large
Ключевым изменением стал переход на архитектуру MMDiT (Multimodal Diffusion Transformer) с тремя специализированными текстовыми энкодерами:
■ OpenCLIP-ViT/G для понимания общего контекста и стилей;
■ CLIP-ViT/L для детального анализа визуальных элементов;
■ T5-XXL для обработки сложных текстовых описаний и пространственных отношений.
Stable Diffusion 3.5 Large станет флагманом компании с 8 миллиардами параметров, способный работать с разрешением до 1 мегапикселя. Помимо него есть также версия Large Turbo, для тех кому критична скорость создания изображения, и версия Stable Diffusion 3.5 Medium, релиз которой ожидается в конце октября, она предложит более облегченную версию с 2.5 миллиардами параметрами, оптимизированными для работы на обычных компьютерах.
Наука и Бизнес