Компания Meta* анонсировала новую модель ИИ-генератора изображений под названием CM3Leon. Эта модель отличается высокой производительностью при преобразовании текста в изображение и является одной из первых, которая может выполнять обратную операцию — создание подписей к изображениям.



В процессе обучения CM3Leon использовались 2 миллиона изображений, лицензированных у Shutterstock, а самая мощная версия модели имеет 7 миллиардов параметров. Кроме того, система получила возможность редактировать изображения по текстовым командам, например, «изменить цвет неба на ярко-синий».



Важной особенностью CM3Leon является его способность воспринимать конкретные команды, вплоть до указания области изображения в пикселях, где должен находиться тот или иной предмет. Это отличает его от других генераторов, таких как DALL-E, которые часто игнорируют подобные детали.



*Запрещенная в РФ организация



Источник