Старший Авгур

Подбор гиперпараметров KTO даёт результаты. Сейчас ещё запустил обучение поверх новых существующих а...
Читать далееПро serverless: за полтора дня вышло 3$, при этом у меня idle timeout 3 минуты, то есть в это время...
Читать далееПоставил третьей моделью gpt-4o в @saiga_igusev_bot, можно пользоваться, запросы и ответы собираю. Н...
Читать далееО двойных BOS токенах в vllm (по мотивам тикета)Рассмотрим на примере meta-llama/Meta-Llama-3-8B-Ins...
Читать далееПерешёл на markdown парсер, добавил отображение наличия ошибки. Ошибки обычно происходят как раз тог...
Читать далее
А теперь можно задавать модель: v4 или kto. По умолчанию kto. Плюс учтите, что если на модели до вас...
Читать далее
Теперь можно задавать системные промпты через set_system.Исходники: bot.py
Читать далееПерешёл на aiogram, стало гораздо лучше, теперь всё параллелится как надо.По вопросам:- Бот работает...
Читать далееВыложил GGUF версию KTO модели, тоже в отдельную ветку (kto). Ещё поднял бота на serverless runpod'е...
Читать далее
Выложил KTO-тюн в отдельную ветку (kto). Выложил бы как v5, но меня всё ещё смущает увеличение длины...
Читать далее