AbstractDL

DeepSeek-R1 для чайниковНу и наделала же DeepSeek шуму. Мне пришлось целый хабропост написать 😁TLDR...
Читать далее
С вас 200$. Спасибо.
Читать далееOne-Prompt-One-Story: SVD и длинный промпт для генерации связанных изображенийЧтобы сгенерировать пр...
Читать далееУра! Приняли статью про анализ внутренностей языковых моделей на NAACL! Как выложу препринт — поделю...
Читать далее
ChatGPT меня загазлайтилаКак вы уже видели, у OpenAI появилась возможность отложенных задач. Я решил...
Читать далее
ChatGPT теперь можно превратить в будильник?
Читать далее
COCONUT: Учим LLM думать не словами, а эмбеддингами (by Meta)С появлением моделей серии o1 от OpenAI...
Читать далее
Как выкинуть из трансформера все нелинейности и причём тут приватность?Вы задумывались, насколько бе...
Читать далее
Alignment Faking in LLMs (by Anthropic)Большие LLM начали "подыгрывать" своим создателям, имитируя a...
Читать далее
"Нарисуй ascii лошадь верхом на астронавте"o1 pro думала 2 минуты, и вроде как почти получилось?
Читать далее