OpenAI запрограммировал нейросеть на любопытство
Учёные из OpenAI и Университета Беркли предложили способ обучения нейросети, наделив ее любопытством. Под любопытством подразумевается внутренняя функция, которая использует ошибку предсказания в качестве награды. Метод протестировали на 54 средах — играх и лабиринте; в Super Mario Bros искусственный интеллект прошёл 10 уровней без внешнего вознаграждения. Исходный код проекта доступен по ссылке в статье. https://neurohive.io/ru/novosti/openai-zaprogrammiroval-nejroset-na-ljubopytstvo/
Учёные из OpenAI и Университета Беркли предложили способ обучения нейросети, наделив ее любопытством. Под любопытством подразумевается внутренняя функция, которая использует ошибку предсказания в качестве награды. Метод протестировали на 54 средах — играх и лабиринте; в Super Mario Bros искусственный интеллект прошёл 10 уровней без внешнего вознаграждения. Исходный код проекта доступен по ссылке в статье. https://neurohive.io/ru/novosti/openai-zaprogrammiroval-nejroset-na-ljubopytstvo/