Основы основ обучения с подкреплением



В последнее время появляется все больше впечатляющих работ: управление плазмой, сумасшедший паркур четырехногого робота и устойчивая двуногая ходьба. Все они основаны на обучении с подкреплением. Ему и посвящена наша новая серия постов.



Вместе мы разберемся с основами этого процесса и уже в первой статье узнаем:

- что такое обучение с подкреплением

- как проходит само обучение

- что такое пространство состояний и действий, траектории и вознаграждения

- два основных подхода к обучению с подкреплением



Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/df13838027b240bf903202731ab3b637?pvs=4