хм, классные ребята из OpenDILab (которые ведут много awesome листиков по RLю и делают либу LightZero) начали делать библиотеку с алгоритмами на диффузионках и flow моделях для принятия решений:



GenerativeRL

https://github.com/opendilab/GenerativeRL



и сразу awesome по диффузионкам в RLе



https://github.com/opendilab/awesome-diffusion-model-in-rl



(сохранять)