Нейроскептик

В своём видео специалист Яндекса простыми словами хорошо объясняет как работают диффузионные нейронные сети при генерации картинок или видео.

Если немного подробнее, то для создания (обучения) диффузионной модели необходимо:

1. Взять начальное изображение.

2. Итеративно добавить Гаусовский шум, пока от исходного ничего не останется, только "облако" из пикселей.

3. Обучить модель шумоподавления приводя это облако к результату, похожему на исходное изображение.

Общая концепция генерации: создайте чистый Гаусовский шум и дайте его обученной модели шумоподавления, чтобы получить абсолютно новое изображение.

Подписаться на Нейроскептик