Агенты ИИ | AGI_and_RL
Meta-Model-Based Meta-Policy Optimization https://arxiv.org/abs/2006.02608
Читать далееLearning Memory-Based Control for Human-Scale Bipedal Locomotion: https://arxiv.org/abs/2006.02402
Читать далееhttps://blog.tensorflow.org/
Читать далееhttps://github.com/openai/multiagent-particle-envs
Читать далееCeres Solver: http://ceres-solver.org/index.html
Читать далееhttps://offline-rl.github.io/
Читать далееMonte Carlo Gradient Estimation in Machine Learning https://arxiv.org/pdf/1906.10652.pdf
Читать далееSome classic: Proximal Policy Optimization Algorithmshttps://arxiv.org/pdf/1707.06347.pdf
Читать далееReinforcement Learning: An Introduction, second edition, 2020Richard S. Sutton and Andrew G. Bartoht...
Читать далееhttps://github.com/edwardhdlu/q-trader
Читать далее