Старший Авгур
Suzume огонь, 10/10 по первым примерами из тест-сета. Через час завершится оценка, вангую что-то тип...
Читать далееО, подъехала мультиязычная gpt-4 синтетика на запросах из lmsys-chat-1m: https://huggingface.co/data...
Читать далее
О_О
Читать далееДосчиталась оценка Опусом, вот весь обучающий датасет Сайги с оценками: https://huggingface.co/datas...
Читать далееhttps://arxiv.org/abs/2404.14047Статья про эмпирическое сравнение квантованных версий Llama3. Да, уж...
Читать далееИ последний пост на сегодня, про GaLore. Выяснились некоторые ограничения их интеграции с HF, которы...
Читать далееЕщё я одним глазом посматриваю на мировые тюны и модификации третьей Лламы:- Dolphin провалился, суд...
Читать далее
Опус обычно не прям уж жёстко зацензурен, но во всём, что касается копирайтов - жесть.Причём у него...
Читать далее
Попробовал GaLore (низкоранговые градиенты), вполне работает. Бонусом обучение сократилось до 40 мин...
Читать далееОбновил датасет Фикбука: https://huggingface.co/datasets/IlyaGusev/ficbookТеперь там 1.4 миллиона фа...
Читать далее