Глубокое Q-обучение



В далеком 2016 году весь IT-мир заговорил об обучении с подкреплением — reinforcement learning, или RL. И неспроста: алгоритм глубокого Q-обучения научился играть в игры Atari на уровне людей-экспертов. С тех пор и проснулся большой интерес к обучению с подкреплением. Многие идеи, которые используются в глубоком Q-обучении, применяются также в современных алгоритмах.



Из этой статьи вы узнаете:

- как адаптировать классическое Q-обучение для решения реальных задач

- какие трюки используют для стабилизации тренировок в глубоком Q-обучении

- и, конечно же, что представляет собой сам алгоритм глубокого Q-обучения



Читайте новую статью по ссылке: https://www.notion.so/deepschool-pro/Q-1ed7a65cc3d24a70928275bf0406296a?pvs=4