Агенты ИИ | AGI_and_RL

Formal Mathematics Statement Curriculum Learning https://arxiv.org/abs/2202.01344

DeepMind выпустил AlphaCode, который прогает лучше половины твоих знакомых.Во многом похож на Codex,...

https://distill.pub/2020/understanding-rl-vision/

Всем привет! В прошлом январе я публиковал конспект по теории RL, собранный из разных курсов по обуч...

Policy Finetuning: Bridging Sample-Efficient Offline and Online Reinforcement Learning https://arxiv...

https://www.pnas.org/content/118/49/e2112672118

https://www.pnas.org/content/117/4/1853

https://deepmind.com/blog/article/exploring-the-beauty-of-pure-mathematics-in-novel-ways

Beyond Fine-Tuning: Transferring Behavior in Reinforcement Learning https://arxiv.org/abs/2102.13515

https://www.youtube.com/watch?v=ELE2_Mftqoc