Добрый день, уважаемые подписчики!
Мы начали монтаж курса по Reinforcement Learning, который был прочитан мной в этом семестре. Выкладываю первую лекцию на тему "Введение в обучение с подкреплением. Многорукие бандиты":
https://youtu.be/vQpc9zSTBhk
Это первая лекция вводного курса по обучению с подкреплением, посвященному обучению рациональных агентов. А рамках лекции рассмотрены приложения обучения с подкреплением, основные понятия.
Также рассмотрен метод многоруких бандитов:
- Эпсилон-жадная стратегия
- Оптимистичная инициализация
- Инкрементальная реализация
- Работа алгоритма в нестационарном окружении.
Лекции продолжат появляться на YouTube-канале:
http://video.razinkov.ai
Мы начали монтаж курса по Reinforcement Learning, который был прочитан мной в этом семестре. Выкладываю первую лекцию на тему "Введение в обучение с подкреплением. Многорукие бандиты":
https://youtu.be/vQpc9zSTBhk
Это первая лекция вводного курса по обучению с подкреплением, посвященному обучению рациональных агентов. А рамках лекции рассмотрены приложения обучения с подкреплением, основные понятия.
Также рассмотрен метод многоруких бандитов:
- Эпсилон-жадная стратегия
- Оптимистичная инициализация
- Инкрементальная реализация
- Работа алгоритма в нестационарном окружении.
Лекции продолжат появляться на YouTube-канале:
http://video.razinkov.ai