Представлена система синтеза изображений Stable Diffusion 2.0🔥
Компания Stability AI опубликовала вторую редакцию системы машинного обучения Stable Diffusion.
1) Новая модель обучена с использованием коллекции LAION-5B, включающей 5.85 миллиардов изображений с текстовыми описаниями.
2) Обновлена модель для модификации изображений - SD 2.0-inpainting, может при помощи текстовых подсказок заменять и изменять части изображения.
3) Вторая версия также сменила кодировщик и теперь может создавать изображения более высокого качества.
4) Представили возможность увеличения разрешения исходного изображения без ухудшения качества позволяя формировать изображения с разрешением 2048x2048.
5) Также продемонстрировали и модель SD2.0-depth2img, учитывающая глубину и пространственное расположение объектов. Это позволяет использовать позу человека на фотографии для формирования другого персонажа в той же позе.
💭Код для обучения нейронной сети и генерации опубликован под лицензией MIT.
Обученные модели открыты под лицензией Creative ML OpenRAIL-M, допускающей использование в коммерческих целях.
Компания Stability AI опубликовала вторую редакцию системы машинного обучения Stable Diffusion.
1) Новая модель обучена с использованием коллекции LAION-5B, включающей 5.85 миллиардов изображений с текстовыми описаниями.
2) Обновлена модель для модификации изображений - SD 2.0-inpainting, может при помощи текстовых подсказок заменять и изменять части изображения.
3) Вторая версия также сменила кодировщик и теперь может создавать изображения более высокого качества.
4) Представили возможность увеличения разрешения исходного изображения без ухудшения качества позволяя формировать изображения с разрешением 2048x2048.
5) Также продемонстрировали и модель SD2.0-depth2img, учитывающая глубину и пространственное расположение объектов. Это позволяет использовать позу человека на фотографии для формирования другого персонажа в той же позе.
💭Код для обучения нейронной сети и генерации опубликован под лицензией MIT.
Обученные модели открыты под лицензией Creative ML OpenRAIL-M, допускающей использование в коммерческих целях.