🕹️ Super Mario против ИИ: кто победит?



Исследователи из Hao AI Lab (Калифорнийский университет) начали использовать Super Mario Bros. для тестирования ИИ. Лидерами оказались Claude 3.7 и Claude 3.5 от Anthropic, а вот GPT-4o и Gemini 1.5 Pro столкнулись с трудностями.



👾 Как это работает?

Игру запустили в эмуляторе и подключили к GamingAgent – фреймворку, который даёт моделям базовые инструкции (например, "прыгай, если враг рядом") и предоставляет скриншоты игрового процесса. Затем ИИ генерирует команды на Python, чтобы управлять персонажем.



🤖 Почему ИИ терпит неудачу?

Модели рассуждений, такие как GPT-4o o1, показали себя хуже из-за задержек в принятии решений. В динамичной игре каждая секунда важна!



🧐 Но есть нюанс…



НейроМозг