Агенты ИИ | AGI_and_RL

Meta-Model-Based Meta-Policy Optimization https://arxiv.org/abs/2006.02608

Читать далее

Learning Memory-Based Control for Human-Scale Bipedal Locomotion: https://arxiv.org/abs/2006.02402

Читать далее

https://blog.tensorflow.org/

Читать далее

https://github.com/openai/multiagent-particle-envs

Читать далее

Ceres Solver: http://ceres-solver.org/index.html

Читать далее

https://offline-rl.github.io/

Читать далее

Monte Carlo Gradient Estimation in Machine Learning https://arxiv.org/pdf/1906.10652.pdf

Читать далее

Some classic: Proximal Policy Optimization Algorithmshttps://arxiv.org/pdf/1707.06347.pdf

Читать далее

Reinforcement Learning: An Introduction, second edition, 2020Richard S. Sutton and Andrew G. Bartoht...

Читать далее

https://github.com/edwardhdlu/q-trader

Читать далее