🔥Palette: одна диффузионная модель и 4 соты (by Google)



Рано или поздно это должно было случиться — гугл представил диффузионную модель, которая умеет почти всё:

- Colorization

- Inpainting

- Uncropping

- JPEG decompression



В каждой задаче их модель значительно обходит все предыдущие решения. Из интересных выводов: self-attention в U-Net очень важен, а L2 лосс лучше чем L1.



P.S. Про диффузионные модели я писал тут.



Статья, блог