🔥Embedding Diffusion for Text Generation (by DeepMind)



Наконец у кого-то получилось применить диффузию для генерации текста.



В качестве базовой модели используется оригинальный трансформер, который учится денойзить эмбеддинги токенов (которые взяли из BERT). Дальше эти эмбеддинги отображаются в логиты и таким образом генерируется текст — сразу весь, целиком.



А ещё тут смогли адаптировать метод classifier-free guidance для заполнения больших пропусков внутри текста.



P.S. на картинке процесс текстовой диффузии.



Статья