Корпорация Meta* анонсировала создание новой модели искусственного интеллекта под названием CM3leon, которая способна генерировать изображения на основе текстовых описаний и создавать текстовые описания на основе изображений. По словам компании, CM3leon требует значительно меньше вычислительных ресурсов и данных для обучения по сравнению с аналогичными моделями, например, DALL-E 2.



Новая модель проявляет впечатляющую производительность в задачах создания подписей к изображениям и визуальных ответов на вопросы. Кроме того, CM3leon может редактировать изображения и отвечать на вопросы, связанные с конкретными изображениями, исходя из текстовых инструкций.



CM3leon обладает способностью обрабатывать сложные объекты и текстовые подсказки с несколькими ограничениями, превосходя даже специализированные модели для добавления субтитров к изображениям.



Компания Meta* не раскрыла планы на выпуск CM3leon и дату его выхода, ссылаясь на проблемы предубеждений, связанные с использованием искусственного интеллекта.



@innovation_station