Еще про DeepFake: на сей раз виртуальный.

#ai_inside



Недавно вышел документальный фильм "Roadrunner" о жизни и карьере знаменитого шеф-повара Энтони Бурдена. Морган Неввилл, режиссер фильма, в своем интервью упомянул, что в фильме есть три момента, в которых голос Энтони сгенерирован нейросетью.



Во-первых, вы только послушайте, как это звучит! Для зрителей, смотревших фильм, это был точно голос Бурдена. В принципе, это неудивительно: автоматическая стилизованная генерация речи с помощью нейросетей достигла небывалых высот, об этом подробно мы писали тут



Во-вторых, интересна реакция фанатов Бурдена на заявление режиссера о дипфейках: они обвинили режиссера в неэтичности. Похоже, дело в том, что фанаты хотят чувствовать "связь" со своим кумиром через фильм, а использование дипфейков как бы делает эту связь ненастоящей.

Сам Морган объяснил решение добавить несколько фрагментов искусственной речи в фильм тем, что хотел "оживить" несколько мыслей главного героя, которые были доступны только в письменном виде.



Многие, напритив, считают, что дипфейки в документалке о Бурдене — это красивая метафора: Roadrunner — это фильм об идентичностях Бурдена и о противоречивых чувствах, которые они вызывали у окружающих и у самой звезды.



Еще интересный момент: режиссер не раскрыл, в каких именно моментах фильма вставлена фейковая речь. Ребята из Pindrop — стартапа, специализирующейся на выявлении телефонного мошенничества — считают, что нашли все три фрагмента фильма, где речь — ненастоящая. Одновременно с ними расследование вели и на Reddit, и пришли к такому же выводу. Главные улики — странное произношение фрикативных согласных и звуков "s" и "f".



Как вы считаете, нормально ли использовать дипфейки для воссоздания голоса умерших людей в фильмах? А внешности? Это помогает почувствовать связь с героем или наоборот, только рушит ее?