Парни вы издеваетесь??? Мы вам дали четкий план, как развиваться в offline RL, а вы так и сидите без аксептов.



Ещё раз, мы выпустили новый релиз CORL, в котором добавили больше датасетов, а также добавили offline-to-online RL.



Помимо этого, мы пошли дальше и выпустили katakomba, которая позволяет легко запускать и бенчмаркать ваши offline RL алгоритмы на нетхаке.



Почитать подробнее можно в твиттер тредах (раз и два), ждем ваших likes. Будем делать хирша на nethack 🧙



P.S. Ребята из дипмайнда уже оценили и догоняют