AI Insider

🦪 Модели генерации изображений — это увлекательные инструменты для изучения структуры визуального мира.

Генеративные модели изображений изучают «скрытое многообразие» визуального мира: низкоразмерное векторное пространство, где каждая точка отображается в изображение. Переход от такой точки коллектора обратно к отображаемому изображению называется «декодированием» — в модели стабильной диффузии этим занимается модель «декодер».

Однако Stable Diffusion — это не просто модель изображения, это также модель естественного языка. Он имеет два скрытых пространства: пространство представления изображения, изученное кодировщиком, используемым во время обучения, и быстрое скрытое пространство, которое изучено с использованием комбинации предварительного обучения и тонкой настройки во время обучения.

Data. Learning. Intelligence