Старший Авгур
Короче, я отведу на пару недель на доработку данных и настройку метричек, новых моделей не будет, то...
Читать далееКороче, я отведу на пару недель на доработку данных и настройку метричек, новых моделей не будет, то...
Читать далее
😳 какой-то урожайный сезон — новая моделька от Mistral 🇫🇷, Large 2 (на 123B параметров)1) 128K конт...
Читать далее
Сайга на T-lite. Есть, правда, нюанс — мне SFT версия органолептически нравится больше, чем KTO верс...
Читать далее
Сайга на T-lite. Есть, правда, нюанс — мне SFT версия органолептически нравится больше, чем KTO верс...
Читать далееПапка уже много поговорила про меня, время поговорить про папку 👍Во-первых, это единственная папка...
Читать далее
И ты, Брут?..
Читать далее
Unsloth, я тебя понял...
Читать далее
Осталось выяснить, какого чёрта embed_tokens и lm_head опять связались после KTO-тюна...
Читать далееВыложил Сайгу на Гемме: ссылкаВ боте тоже доступна после /setmodel.
Читать далее