
#shitpost
Что надо: как ставить OKR, как делегировать, как репортить стейкхолдерам, как укрощать неопределенность
Что я делаю: перед собесом надо наконец разобраться в RL/RLHF/DPO/alignment, зачитался сначала статьями, потом сиолошной, затем и вовсе завис на классике – как научить RL играть в змейку (не, не прокрастинация; видео, GitHub). Как же это все-таки охуенно!
пс. ну и да, легендарный мем всех времен и народов
пс2. на IJCAI 2015 в Буэнос-Айресе вживую наблюдал, как DeepMind впервые представлял успехи в Atari (2min papers тех времен с уровнем Бог в арканоиде; вот это уже прокрастинация)
Что надо: как ставить OKR, как делегировать, как репортить стейкхолдерам, как укрощать неопределенность
Что я делаю: перед собесом надо наконец разобраться в RL/RLHF/DPO/alignment, зачитался сначала статьями, потом сиолошной, затем и вовсе завис на классике – как научить RL играть в змейку (не, не прокрастинация; видео, GitHub). Как же это все-таки охуенно!
пс. ну и да, легендарный мем всех времен и народов
пс2. на IJCAI 2015 в Буэнос-Айресе вживую наблюдал, как DeepMind впервые представлял успехи в Atari (2min papers тех времен с уровнем Бог в арканоиде; вот это уже прокрастинация)