(sci)Berloga Всех Наук и Технологий

🚀 @SBERLOGASCI вебинар/обсуждение :

👨‍🔬 Богдан Булатов, Ульяна Князюк, Михаил Ураков "Применение Q-learning и SARSA к задаче короткого пути на графах. Разбор ноутбуков"

⌚️ Вторник, 19 Марта, 19.00 по Москве

Add to Google Calendar

Вводное обсуждение по методам RL (reinforcement learning) - Q-learning and SARSA. С разбором ноутбуков, которые применяют эти методы к задаче поиска короткого пути на графах. Нам желательно освоить детально эти простые методы, чтобы эффективней двигаться дальше. Желательно понять насколько эти методы плохо/хорошо масштабируются на большие графы, и как эффективность методов зависит от самой структуры графов (графы попроще - типа решеток, графы посложнее - скажем граф состояний кубика Рубика, или любой случайной группы). Дальнейший шаг - как улучшить методы, чтобы было возможно решать задачу короткого пути на огромных графов - большие кубики и подобные группы.

Ноутбуки:

Богдан , Ульяна , Михаил

(Апвоуты - приветствуются ! )

Исходный ноутбук: https://www.kaggle.com/code/prabhakarkalaiselvan/shortest-path-in-undirected-graph-using-rl-methods

В ноутбуке Богдана:

"+ реализовал метод Cross Entropy

+ изменил методику назначения reward. Автор оригинального поста присуждает 0 всем возможным граням. Мне кажется, что лучше присуждать -1. Так траектории с более коротким маршрутом получат больше итоговой награды, чем более длинные траектории (штрафуем за лишние шаги). Это может сыграть роль на более сложных примерах, а так же поможет сравнивать работу различных алгоритмов

"

Zoom link: @sberlogabig at start.

Videos: https://www.youtube.com/c/SciBerloga - subscribe !

📖 Presentation

📹 Video

—————————-

Мы организуем активность по изучению методов ML/RL и применению их к математическим задачам теории групп/графов, если Вам интересно присоединиться - отметьтесь в голосовалке : https://t.me/sberlogasci/7794 . Более подробная инфа тут: https://t.me/sberlogabig/374.