AbstractDL

Обнаружил что-то странное, чатгпт игнорирует всё, что похоже на спецтокены. Наверное, это защита от...
Читать далее
The Little Book of Deep Learning Карманная книга по DL от профессора из Женевского Университета Fran...
Читать далее
LightGlue: Local Feature Matching at Light Speed (by Microsoft)Появилась новая SOTA по качеству и ск...
Читать далее
Direct Preference Optimization: Your Language Model is Secretly a Reward Modelarxiv.org/abs/2305.182...
Читать далее
Understanding Optimization of Deep LearningКрутой обзор всех аспектов и методов оптимизации нейронны...
Читать далееMEMIT: Где именно GPT хранит свои знания? (by MIT)Оказалось, что память у трансформеров находится в...
Читать далее
SkoltechТри года назад я закончил Сколтех, и поступить туда — было лучшим решением в моей жизни. Нас...
Читать далее
🔥QLoRA: Зафайнтюнить 30B модель в колабе? Легко!Гениальная и удивительно простая идея лежит в основ...
Читать далее
TinyStories: The Smallest GPT with Coherent English (by Microsoft)Как думаете, с какого размера у LM...
Читать далее
DarkBERT: A Language Model for the Dark Side of the InternetПока в EU пытаются зарегулировать AI вус...
Читать далее