Беспилот | БПЛА, дроны, роботы

Ученые научили роботов любопытству.

Швейцарские инженеры разработали для робособаки на колесах алгоритм управления, основанный на методе обучения с подкреплением, мотивированным любопытством.

Вместо множества отдельных наград за подзадачи разработчики использовали только одну, которую робособака ANYmal получает за достижение конечной цели.

В итоге робопес сам ищет правильную последовательность действий, и это побуждает его исследовать среду и делать то, что он еще не делал, приобретая новые навыки.