Классные новости – научные семинары Института AIRI теперь будут проходить регулярно 🥳



🗓 16 ноября в 17:00 на семинаре выступит научный сотрудник AIRI из команды «Новые нейронные архитектуры» Артем Сорокин с докладом «Рабочая память через минимизацию неопределенности».



В этот раз будет разбираться тема рабочей памяти, она является основным инструментом для интеллектуального поведения. Она позволяет использовать информацию из прошлого для быстрой адаптации в изменчивых и частично-наблюдаемых средах. Благодаря этому агенты принимают правильные решения в ситуациях, когда они не обладают полной информацией о текущем состоянии среды. Однако, несмотря на многочисленные попытки развития эффективной долговременной памяти в задачах обучения с подкреплением, это направление исследований всё еще оставляет открытые проблемы.



Современные подходы к проблеме обучения долгосрочным временным зависимостям в основном связаны с градиентными методами. В этом случае, за один шаг градиентного спуска необходимо подать всю временную зависимость с промежуточными шагами на вход модели. Использование полной истории наблюдений не позволяет масштабировать чисто градиентные методы для изучения долгосрочных зависимостей в среде.

👨‍💻 Артем Сорокин расскажет о решении, которое избегает обработки полной истории наблюдений. Полученный результат также будет представлен на конференции NeurIPS 2022.



⚖️ Важное нововведение: теперь в семинарах участвуют оппоненты, которые будут комментировать выступление докладчика.



В следующую среду оппонентом выступит кандидат физико-математических наук, старший преподаватель Сколтех Максим Панов.



⚡️ #AIRIseminars будут транслироваться на Ютуб, подписывайтесь, чтобы не пропустить!