#shitpost



Что надо: как ставить OKR, как делегировать, как репортить стейкхолдерам, как укрощать неопределенность



Что я делаю: перед собесом надо наконец разобраться в RL/RLHF/DPO/alignment, зачитался сначала статьями, потом сиолошной, затем и вовсе завис на классике – как научить RL играть в змейку (не, не прокрастинация; видео, GitHub). Как же это все-таки охуенно!



пс. ну и да, легендарный мем всех времен и народов



пс2. на IJCAI 2015 в Буэнос-Айресе вживую наблюдал, как DeepMind впервые представлял успехи в Atari (2min papers тех времен с уровнем Бог в арканоиде; вот это уже прокрастинация)