Продолжаем делиться нашими успехами!
Статья популярного Дениса Тарасова (@adagrad), легендарного Влада Куренкова (@vkurenkov) и Сергея Колесникова (@scitator) про использование предобученных языковых моделей для Offline RL задач попала на воркшоп по Generalizable Policy Learning in the Physical World на ICLR 2022.
Мы рассказывали об этой статье на наших прошлых ивентах, но теперь можно почитать в .pdf!
Статья популярного Дениса Тарасова (@adagrad), легендарного Влада Куренкова (@vkurenkov) и Сергея Колесникова (@scitator) про использование предобученных языковых моделей для Offline RL задач попала на воркшоп по Generalizable Policy Learning in the Physical World на ICLR 2022.
Мы рассказывали об этой статье на наших прошлых ивентах, но теперь можно почитать в .pdf!