AbstractDL

CALM: как простые слова генерировать быстрее (by Google)Оказывается, можно пропускать часть слоёв тр...

Читать далее

А вы знали, что GPT-3 токенизирует русский язык просто отвратительно? Тут токенов больше чем букв! Я...

Читать далее

GPT тайно файнтюнит себя через attention во время инференса (by Microsoft)Авторы немного поколдовали...

Читать далее

Тут прогнали chatGPT через текстовый тест на IQ, и оказалось, что он равен 83. Вероятно, AGI апокали...

Читать далее

ChatGPT — чатбот от OpenAIВ основе лежит GPT-3, затюненная аналогичным instructGPT способом. Сначала...

Читать далее

Совсем недавно вышла бета версия библиотеки TorchMultimodal (ссылка), в которой авторы постарались с...

Читать далее

Kandinsky 2.0: первая мультиязычная диффузия! (by AIRI, SberAI, SberDevices)Встречайте первую text2i...

Читать далее

Galactica general-purpose scientific language modelMeta AI и Paperswithcode зарелизили первую 120B м...

Читать далее

MinD-Vis: диффузия для чтения мыслейПредставлена диффузионная модель, которая умеет декодировать то,...

Читать далее

OneFormer: One Transformer to Rule Universal Image SegmentationНам в компьютерном зрении давно нужен...

Читать далее