Старший Авгур

Опус и последний Соннет - единственные языковые модели общего названия, которые могут писать стихи....

Читать далее

Опус и типичные загадки.В целом, они ещё подходят для теста локальных моделей, но по-моему что у Ope...

Читать далее

Прокинул в новый Клод инструменты (генератор картинок, чтение веб-страничек, поиск). Разница в API и...

Читать далее

Новый Клод и saiga_llama3_70b_sft_m1_d5_abliterated_kto_m1_d2_awq_4bit (ну и название) доступны в бо...

Читать далее

Стало лучше, но на SFT тюне AWQ всё равно лучше оригинала... Хорошо хоть только в LC-винрейте.

Читать далее

не понялПоставил считаться с saiga_llama3_70b_sft_m1_d5_abliterated в качестве опорной точки.

Читать далее

Позиционная кодировкаЕсть одна особенность трансформеров, которой люди обычно уделяют незаслуженно м...

Читать далее

Планирую подрезать лимиты моделей в два раза. Подписок нет, донатов нет, счёт за gpt-4o за вчерашний...

Читать далее

Помните вот эту ситуацию? Когда человек утверждал, что LLM не могут решить какую-то задачу, утвердил...

Читать далее

KTO 70B, причём off-policy. Что же будет, когда я туда примеры из самой модели подложу...А, и phi3-m...

Читать далее