хм, классные ребята из OpenDILab (которые ведут много awesome листиков по RLю и делают либу LightZero) начали делать библиотеку с алгоритмами на диффузионках и flow моделях для принятия решений:
GenerativeRL
https://github.com/opendilab/GenerativeRL
и сразу awesome по диффузионкам в RLе
https://github.com/opendilab/awesome-diffusion-model-in-rl
(сохранять)
GenerativeRL
https://github.com/opendilab/GenerativeRL
и сразу awesome по диффузионкам в RLе
https://github.com/opendilab/awesome-diffusion-model-in-rl
(сохранять)