Machinelearning

Наверняка вы уже слышали, что прогамма AlphaGo обыграла сильнейшего игрока по игре Go в трёх матчах. Не прошло и года, как AlphaGo проиграла. Сто матчей из ста.

Встречайте нового победителя — AlphaGo Zero.

Новость не была бы такой интересной (ничего удивительного, что новая версия обыграла старую), если бы не одно но — новая версия была создана с нуля, и она (в отличие от AlphaGo)... не обучалась на партиях игроков–людей, а просто играла сама с собой. Сначала она делала бессмысленные случайные ходы, но уже через три дня, сыграв почти 5 млн партий, сумела обыграть предыдущего чемпиона с разгромным счётом.

Вдумайтесь — новая программа была получена путём выбрасывания из неё наших человеческих знаний об игре. В связи с чем она смогла освободиться от лишних ограничений и изобрела свои собственные превосходящие стратегии. То есть человеческое знание для обучения роботов не только бесполезно, но и вредно.

По правде сказать, в новой программе сделано ещё несколько изменений, и в частности такое — она запоминает, как каждый конкретный ход повлиял на окончательный результат, и на основе этого корректирует ходы в новых партиях. Но тем не менее. #ML #DataMining #deeplearning #neuralnets #neuralnetworks #neuralnetworks #ArtificialIntelligence #MachineLearning #DigitalTransformation #tech #ML #python