
Frido- новая реализация диффузной модели, которая обещает дать больше контроля над сценой.
Дифузные модели уже всем доказали что могут генерировать высококачественные изображения по текстовым запросам. Но вот контролировать получаемый результат практически невозможно и поэтому крайне сложно получить от нейросети результат по конкретному тз.
Эту проблемы и попробовали решить иследователи из Национального Университета Тайваня и Microsoft в новой нейронной сети Frido.По словам разработчиков их модель способна превратить в изображение как текст, так и макет. Но и на этом разработчики не останавливаются и обещают выпустить модель для трансформации графа сцены в изображение.
Будете пробовать эту модель сами? Интересно было бы узнать что эта сеть может на практике?
Статья
Код
Дифузные модели уже всем доказали что могут генерировать высококачественные изображения по текстовым запросам. Но вот контролировать получаемый результат практически невозможно и поэтому крайне сложно получить от нейросети результат по конкретному тз.
Эту проблемы и попробовали решить иследователи из Национального Университета Тайваня и Microsoft в новой нейронной сети Frido.По словам разработчиков их модель способна превратить в изображение как текст, так и макет. Но и на этом разработчики не останавливаются и обещают выпустить модель для трансформации графа сцены в изображение.
Будете пробовать эту модель сами? Интересно было бы узнать что эта сеть может на практике?
Статья
Код