Старший Авгур
Опус и последний Соннет - единственные языковые модели общего названия, которые могут писать стихи....
Читать далее
Опус и типичные загадки.В целом, они ещё подходят для теста локальных моделей, но по-моему что у Ope...
Читать далее
Прокинул в новый Клод инструменты (генератор картинок, чтение веб-страничек, поиск). Разница в API и...
Читать далееНовый Клод и saiga_llama3_70b_sft_m1_d5_abliterated_kto_m1_d2_awq_4bit (ну и название) доступны в бо...
Читать далее
Стало лучше, но на SFT тюне AWQ всё равно лучше оригинала... Хорошо хоть только в LC-винрейте.
Читать далее
не понялПоставил считаться с saiga_llama3_70b_sft_m1_d5_abliterated в качестве опорной точки.
Читать далееПозиционная кодировкаЕсть одна особенность трансформеров, которой люди обычно уделяют незаслуженно м...
Читать далееПланирую подрезать лимиты моделей в два раза. Подписок нет, донатов нет, счёт за gpt-4o за вчерашний...
Читать далееПомните вот эту ситуацию? Когда человек утверждал, что LLM не могут решить какую-то задачу, утвердил...
Читать далее
KTO 70B, причём off-policy. Что же будет, когда я туда примеры из самой модели подложу...А, и phi3-m...
Читать далее