Q-Learning



Q-Обучение — один из фундаментальных алгоритмов обучения с подкреплением. Его использовали ещё при обучении агентов в играх на Атари. Он актуален и сегодня — применяется, например, в офлайн-обучении с подкреплением.



Из новой статьи вы узнаете:

- как работают методы обучения с подкреплением, основанные на функции ценности

- какие есть методы для оценки этой функции

- что такое уравнение Беллмана

- и конечно же, какой алгоритм у Q-обучения.



Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/Q-314e0f83efb14ef19b12ffaacfc2b4a6?pvs=4