Гуманоид лежит на траве, он корчится и не может встать. Примерно так началось обучение виртуальных человечков игре в футбол ⚽️



На Wired вышла забавная заметка о том, как исследователи из гугловской DeepMind шаг за шагом разрабатывали сильный ИИ (AGI), который сможет пинать мяч не хуже человека-футболиста.



Зачем вообще это нужно? Чтобы роботы будущего и аватары в метавселенных двигались максимально естественно, как реальные люди 🕺🏿 Футбол здесь — не конечная цель, а способ обучения.



Сначала учёные создали модельки с ограниченным диапазоном движений. Гуманоиды не могут выворачивать коленный сустав, чтобы лучше подстроиться под мяч. В общем, анатомия получилась близкой к человеческой.



Чуть ли не самым сложным оказалось научить AGI управлению телом, координацией 🦿 Ведь для этого нужно овладеть и моторикой, и долгосрочным планированием. Если вам кажется, что ничего сложного здесь нет — ̶п̶о̶с̶м̶о̶т̶р̶и̶т̶е̶ ̶н̶а̶ ̶н̶а̶ш̶и̶х̶ ̶ф̶у̶т̶б̶о̶л̶и̶с̶т̶о̶в̶ попробуйте сыграть в браузерную QWOP. Задача элементарная: заставить человечка идти и не падать. Через пару попыток поймёте, в чем загвоздка.



🤖 Для начала в DeepMind поставили перед виртуальными агентами цель: пробежать или ударить по мячу. Но метод обучения с подкреплением не сработал из-за огромного количества вариантов и недостатка предварительных знаний — модельки просто корчились на земле.



Тогда учёные «скормили» ИИ данные, которые получили с помощью захвата движения реальных футболистов. Это ограничило гуманоидов — через какое-то время их движения стали похожи на человеческие.



Дальше «спортсменов» начали учить дриблингу, бегу и удару по мячу. И только после этого их допустили до матчей. Сначала модельки хаотично бегали за мячом, как собаки за фрисби 🐕 Они постоянно спотыкались и почти падали. Голы залетали в ворота случайно, мяч удачно отскакивал от стены.



Но через несколько дней тренировок футболисты научились командной работе. Теперь они не просто тупо бегут к воротам с мячом, но ждут партнёров и даже пасуются (ну, или пытаются). Учёные говорят, что впервые видят такую координацию в настолько сложной модели ИИ.



Видео: https://www.youtube.com/watch?v=KHMwq9pv7mg&t=49s