Добрый день, уважаемые подписчики!



Мы начали монтаж курса по Reinforcement Learning, который был прочитан мной в этом семестре. Выкладываю первую лекцию на тему "Введение в обучение с подкреплением. Многорукие бандиты":

https://youtu.be/vQpc9zSTBhk



Это первая лекция вводного курса по обучению с подкреплением, посвященному обучению рациональных агентов. А рамках лекции рассмотрены приложения обучения с подкреплением, основные понятия.

Также рассмотрен метод многоруких бандитов:

- Эпсилон-жадная стратегия

- Оптимистичная инициализация

- Инкрементальная реализация

- Работа алгоритма в нестационарном окружении.



Лекции продолжат появляться на YouTube-канале:

http://video.razinkov.ai