Прочитала тут свежее интервью с создателем нейрогенератора изображений Midjourney Дэвидом Хольцем. Держите самое интересное



🎨Как появились инструменты генерации изображений?

К этому привели два прорыва в области ИИ. Один из них — понимание языка, второй — способность создавать образы. И когда вы объединяете эти вещи, то можете создавать образы с помощью понимания языка.



📚Откуда берутся данные для обучения?

Из интернета. Практически каждая крупная модель ИИ просто извлекает все данные, которые может извлечь.



Сейчас мы на ранней стадии развития — каждый берёт всё возможное, сваливает это в огромный файл и «скармливает» алгоритму. Но никто ещё толком не знает, какие данные в этой куче реально важны.



💰Сколько примерно стоит обучение такой модели?

Около 50 тысяч долларов за сеанс. Но вы никогда не сделаете всё правильно с первой попытки: иногда придётся пробовать десятки раз.



Каждое изображение модель создаёт на сервере стоимостью 20 тысяч долларов, и нам приходится арендовывать их поминутно.



👩‍🎨 Может ли быть авторский стиль у нейросети?

У алгоритма есть несколько любимых цветов и несколько любимых лиц. Если вы дадите ему слишком расплывчатую инструкцию, он перейдёт к своим фаворитам.



Мы не понимаем, почему это происходит, но есть, например, одно женское лицо, которое ему нравится рисовать. Никто не знает, откуда оно взялось, — видимо, из одного из наших 12 обучающих датасетов.



🧠 Как вы воспринимаете искусственный интеллект?

Сейчас люди совершенно неправильно понимают суть ИИ. Они видят в нём тигра — он опасен, может съесть меня. В воде тоже есть опасность — в ней можно утонуть.



Но опасность текущей реки сильно отличается от опасности тигра… Вода — двигатель цивилизации. У неё нет воли и злобы. Да, в ней можно утонуть, но это не значит, что мы должны запретить воду. Поэтому, когда вы находите новый источник воды, — это всегда хорошо.



🎮 Что в ближайшем будущем?

В течение следующего года или двух вы сможете создавать контент в реальном времени: 30 кадров в секунду, высокое разрешение. Это будет дорого, но возможно. Через 10 лет сможете купить приставку с гигантскими ИИ-процессорами и будете запускать на нём все игры мечты.