#news #cv



IMAGEN. Google наносит ответный удар.



🌗 Пока OpenAI продолжает не делиться своими моделями по генерации изображений, а энтузиасты делают свой велосипед из подручных средств, в компании Google сделали аналог DALL-E2 и назвали его IMAGEN. Модель эта, судя по представленным рендерам, не уступает первой, картинки действительно очень прикольные.



Немного деталей:



Внутри модели генератор изображений 64x64 на 2B параметров.

Затем идёт upscale (улучшение качества) до размера 1024x1024 еще одной моделью на 1B параметров.

Языковой моделью (LM), кодирующей текстовые подсказки, служит T5 на 4.6B параметров. По словам исследователей, именно увеличение объема LM дало больший прирост качества финальной картинки.



🌗 Пока что попробовать ничего нельзя. Зато у нас есть уже две крутые модели, на которые можно пускать слюнки в ожидании чуда.



Обзор | Статья