🦪 Модели генерации изображений — это увлекательные инструменты для изучения структуры визуального мира.



Генеративные модели изображений изучают «скрытое многообразие» визуального мира: низкоразмерное векторное пространство, где каждая точка отображается в изображение. Переход от такой точки коллектора обратно к отображаемому изображению называется «декодированием» — в модели стабильной диффузии этим занимается модель «декодер».



Однако Stable Diffusion — это не просто модель изображения, это также модель естественного языка. Он имеет два скрытых пространства: пространство представления изображения, изученное кодировщиком, используемым во время обучения, и быстрое скрытое пространство, которое изучено с использованием комбинации предварительного обучения и тонкой настройки во время обучения.



Data. Learning. Intelligence