Q-Learning
Q-Обучение — один из фундаментальных алгоритмов обучения с подкреплением. Его использовали ещё при обучении агентов в играх на Атари. Он актуален и сегодня — применяется, например, в офлайн-обучении с подкреплением.
Из новой статьи вы узнаете:
- как работают методы обучения с подкреплением, основанные на функции ценности
- какие есть методы для оценки этой функции
- что такое уравнение Беллмана
- и конечно же, какой алгоритм у Q-обучения.
Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/Q-314e0f83efb14ef19b12ffaacfc2b4a6?pvs=4
Q-Обучение — один из фундаментальных алгоритмов обучения с подкреплением. Его использовали ещё при обучении агентов в играх на Атари. Он актуален и сегодня — применяется, например, в офлайн-обучении с подкреплением.
Из новой статьи вы узнаете:
- как работают методы обучения с подкреплением, основанные на функции ценности
- какие есть методы для оценки этой функции
- что такое уравнение Беллмана
- и конечно же, какой алгоритм у Q-обучения.
Читайте нашу статью по ссылке: https://www.notion.so/deepschool-pro/Q-314e0f83efb14ef19b12ffaacfc2b4a6?pvs=4