Обучение с подкреплением (reinforcement learning, RL) — один из способов машинного обучения, в ходе которого испытуемая система (агент) обучается, взаимодействуя с некоторой средой.

Данный курс - это версия для студентов YSDA и ВШЭ (весна 2019 года). Для полных материалов курса необходимо переключиться на главную ветвь. Для всех материалов, которые мало описаны, есть ссылки на дополнительную информацию и связанные материалы (D.Silver / Sutton / blogs / и т.д.).



#полезностьдня



http://clc.am/FsQFzw