Агенты ИИ | AGI_and_RL
Formal Mathematics Statement Curriculum Learning https://arxiv.org/abs/2202.01344
Читать далееDeepMind выпустил AlphaCode, который прогает лучше половины твоих знакомых.Во многом похож на Codex,...
Читать далееhttps://distill.pub/2020/understanding-rl-vision/
Читать далееВсем привет! В прошлом январе я публиковал конспект по теории RL, собранный из разных курсов по обуч...
Читать далееPolicy Finetuning: Bridging Sample-Efficient Offline and Online Reinforcement Learning https://arxiv...
Читать далееhttps://www.pnas.org/content/118/49/e2112672118
Читать далееhttps://www.pnas.org/content/117/4/1853
Читать далееhttps://deepmind.com/blog/article/exploring-the-beauty-of-pure-mathematics-in-novel-ways
Читать далееBeyond Fine-Tuning: Transferring Behavior in Reinforcement Learning https://arxiv.org/abs/2102.13515
Читать далееhttps://www.youtube.com/watch?v=ELE2_Mftqoc
Читать далее