AbstractDL

DeepSeek-R1 для чайниковНу и наделала же DeepSeek шуму. Мне пришлось целый хабропост написать 😁TLDR...

С вас 200$. Спасибо.

One-Prompt-One-Story: SVD и длинный промпт для генерации связанных изображенийЧтобы сгенерировать пр...

Ура! Приняли статью про анализ внутренностей языковых моделей на NAACL! Как выложу препринт — поделю...

ChatGPT меня загазлайтилаКак вы уже видели, у OpenAI появилась возможность отложенных задач. Я решил...

ChatGPT теперь можно превратить в будильник?

COCONUT: Учим LLM думать не словами, а эмбеддингами (by Meta)С появлением моделей серии o1 от OpenAI...

Как выкинуть из трансформера все нелинейности и причём тут приватность?Вы задумывались, насколько бе...

Alignment Faking in LLMs (by Anthropic)Большие LLM начали "подыгрывать" своим создателям, имитируя a...

"Нарисуй ascii лошадь верхом на астронавте"o1 pro думала 2 минуты, и вроде как почти получилось?