Крайне интересная статейка по RL от UBER https://eng.uber.com/deep-neuroevolution/