🚀Kandinsky 2.1🚀

Наступил день, которого ждала вся команда (вовсе не тот, который стал всплывать в разных каналах на прошлой неделе😂). Сегодня мы официально выпускаем новую лучшую версию нашей диффузионной генеративной модели, которая претерпела существенные изменения относительно предшественницы 2.0.



Отличительные особенности включают:

📌3.3B параметров

📌Разрешение генераций - 768x768

📌Image prior трансформер

📌Новый автоэнкодер изображений MoVQ

📌Дообучение на очень чистом сете из 172M пар «текст-изображение»

📌Режимы работы: генерация по тексту, смешивание изображение, генерация изображений по образцу, изменение изображений по тексту, inpainting/outpainting



Всё это позволило добиться впечатляющего качества на различных доменах генераций.



FID на датасете COCO_30k достигает значения 8.21🔥 По публичным данным на сегодняшний день лучше только eDiffI (NVidia) и Imagen (Google Reseacrh).



Детально о модели можно прочитать в статье на Хабре, а протестировать Kandinsky 2.1 можно тут:

📍Телеграм-бот

📍FusionBrain.AI

📍GitHub

📍HuggingFace

📍rudalle.ru

📍MLSpace



Спасибо всей команде за слаженную и качественную работу - испытываю несказанное признание каждому🔥



@complete_ai