Основы основ обучения с подкреплением
В последнее время появляется все больше впечатляющих работ: управление плазмой, сумасшедший паркур четырехногого робота и устойчивая двуногая ходьба. Все они основаны на обучении с подкреплением. Ему и посвящена наша новая серия постов.
Вместе мы разберемся с основами этого процесса и уже в первой статье узнаем:
- что такое обучение с подкреплением
- как проходит само обучение
- что такое пространство состояний и действий, траектории и вознаграждения
- два основных подхода к обучению с подкреплением
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/df13838027b240bf903202731ab3b637?pvs=4
В последнее время появляется все больше впечатляющих работ: управление плазмой, сумасшедший паркур четырехногого робота и устойчивая двуногая ходьба. Все они основаны на обучении с подкреплением. Ему и посвящена наша новая серия постов.
Вместе мы разберемся с основами этого процесса и уже в первой статье узнаем:
- что такое обучение с подкреплением
- как проходит само обучение
- что такое пространство состояний и действий, траектории и вознаграждения
- два основных подхода к обучению с подкреплением
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/df13838027b240bf903202731ab3b637?pvs=4