GLIDE: модель OpenAI генерации изображений по тексту



GLIDE — модель OpenAI генерации изображения по его описанию. GLIDE превосходит DALL-E и при этом имеет в 3 раза меньше параметров.



GLIDE — диффузионную модель, которая обеспечивает производительность, конкурентоспособную с DALL-E, при использовании менее одной трети ее параметров (3.5 млрд параметров против 12 млрд). Недавние исследования показали, что диффузионные модели обладают способностью генерировать высококачественные синтетические изображения.



В дополнение к генерации изображений из текста, GLIDE также можно использовать для редактирования существующих изображений — например, вставки новых объектов, добавления теней и отражений — с помощью текстовых подсказок на естественном языке. Также GLIDE может преобразовывать простые наброски в фотореалистичные изображения.



Источник новости



Github проекта



#нейросети_практика #обучение #интересное