Глубокое Q-обучение
В далеком 2016 году весь IT-мир заговорил об обучении с подкреплением — reinforcement learning, или RL. И неспроста: алгоритм глубокого Q-обучения научился играть в игры Atari на уровне людей-экспертов. С тех пор и проснулся большой интерес к обучению с подкреплением. Многие идеи, которые используются в глубоком Q-обучении, применяются также в современных алгоритмах.
Из этой статьи вы узнаете:
- как адаптировать классическое Q-обучение для решения реальных задач
- какие трюки используют для стабилизации тренировок в глубоком Q-обучении
- и, конечно же, что представляет собой сам алгоритм глубокого Q-обучения
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Q-1ed7a65cc3d24a70928275bf0406296a?pvs=4
В далеком 2016 году весь IT-мир заговорил об обучении с подкреплением — reinforcement learning, или RL. И неспроста: алгоритм глубокого Q-обучения научился играть в игры Atari на уровне людей-экспертов. С тех пор и проснулся большой интерес к обучению с подкреплением. Многие идеи, которые используются в глубоком Q-обучении, применяются также в современных алгоритмах.
Из этой статьи вы узнаете:
- как адаптировать классическое Q-обучение для решения реальных задач
- какие трюки используют для стабилизации тренировок в глубоком Q-обучении
- и, конечно же, что представляет собой сам алгоритм глубокого Q-обучения
Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Q-1ed7a65cc3d24a70928275bf0406296a?pvs=4