Разработка компании OpenAI умеет собирать кубик Рубика с помощью одной роботизированной руки



ИИ-система, как указывается, обучалась методом проб и ошибок; по словам Петера Велиндера (Peter Welinder), одного из участников команды разработчиков, вначале система не знала ничего о том, как двигать рукой или как будет реагировать кубик Рубика.



При успешно выполненной манипуляции с головоломкой система зарабатывала очки — и была запрограммирована так, чтобы их максимизировать. Сначала система тренировалась в симуляции, а затем перешла к тестам с реальным кубиком Рубика.



Отмечается, что ИИ не должен был понять, как решить головоломку.



Визуальные датчики и специальный алгоритм для решения давали ему инструкции о необходимых движениях, так что ИИ концентрировался именно на необходимых движениях (и учился в том числе исправлять ошибки).



В ходе наиболее удачной попытки, система смогла собрать кубик примерно за три минуты.



Смотреть: https://youtu.be/kVmp0uGtShk