
#news #cv
IMAGEN. Google наносит ответный удар.
🌗 Пока OpenAI продолжает не делиться своими моделями по генерации изображений, а энтузиасты делают свой велосипед из подручных средств, в компании Google сделали аналог DALL-E2 и назвали его IMAGEN. Модель эта, судя по представленным рендерам, не уступает первой, картинки действительно очень прикольные.
Немного деталей:
• Внутри модели генератор изображений 64x64 на 2B параметров.
• Затем идёт upscale (улучшение качества) до размера 1024x1024 еще одной моделью на 1B параметров.
• Языковой моделью (LM), кодирующей текстовые подсказки, служит T5 на 4.6B параметров. По словам исследователей, именно увеличение объема LM дало больший прирост качества финальной картинки.
🌗 Пока что попробовать ничего нельзя. Зато у нас есть уже две крутые модели, на которые можно пускать слюнки в ожидании чуда.
Обзор | Статья
IMAGEN. Google наносит ответный удар.
🌗 Пока OpenAI продолжает не делиться своими моделями по генерации изображений, а энтузиасты делают свой велосипед из подручных средств, в компании Google сделали аналог DALL-E2 и назвали его IMAGEN. Модель эта, судя по представленным рендерам, не уступает первой, картинки действительно очень прикольные.
Немного деталей:
• Внутри модели генератор изображений 64x64 на 2B параметров.
• Затем идёт upscale (улучшение качества) до размера 1024x1024 еще одной моделью на 1B параметров.
• Языковой моделью (LM), кодирующей текстовые подсказки, служит T5 на 4.6B параметров. По словам исследователей, именно увеличение объема LM дало больший прирост качества финальной картинки.
🌗 Пока что попробовать ничего нельзя. Зато у нас есть уже две крутые модели, на которые можно пускать слюнки в ожидании чуда.
Обзор | Статья