Berkeley представили реализацию Cal-QL способного решать всё. Более того, они выложили код с WandB логами. А знаете где еще есть вандб логи? Конечно же, в CORL. CORL – это компьютерная python библиотека с реализациями Offline RL алгоритмов с элементами симулятора, посвященная обучению роботов, агентов и cheetah периода до jax. Проект разрабатывается и издаётся компанией Tinkoff