Runway попалась на использовании контента YouTube для обучения ИИ



Компания Runway, разрабатывающая инструменты для генерации видео с помощью искусственного интеллекта, оказалась в центре скандала. Издание 404 Media опубликовало расследование, которое утверждает, что Runway использовала для обучения своей ИИ-модели тысячи видео с YouTube, в том числе контент известных медиакомпаний и популярных блогеров, не имея на это разрешения.



В списке каналов, которые, по всей видимости, использовались для обучения модели, фигурируют Netflix, Disney, Nintendo, Rockstar Games, а также популярные блогеры, такие как MKBHD, Linus Tech Tips и Sam Kolder.



По словам бывшего сотрудника Runway, эта таблица состоит из списка каналов, которые были отобраны для сбора качественных видео для обучения модели. Ссылки использовались для скачивания контента с помощью прокси-серверов, чтобы избежать блокировок со стороны Google.



Кроме того, в таблице обнаружены ссылки на пиратские сайты, демонстрирующие лицензионные фильмы бесплатно. Пока не ясно, использовала ли Runway эти фильмы для обучения модели Gen-3 Alpha, но, как отмечает The Verge, узнать это будет, скорее всего, невозможно.



Важно отметить, что Runway – не единственная компания, использующая YouTube для обучения ИИ-моделей. Ранее в этом году технический директор OpenAI Мира Мурати признала, что не уверена, обучалась ли их модель Sora на контенте из YouTube. Совместное расследование Proof News и Wired также показало, что Anthropic, Apple, Nvidia и Salesforce обучали свои модели ИИ на более чем 170 000 видео с YouTube.



Ссылка на статью 404 Media



Ссылка на статью The Verge



Ссылка на таблицу с данными