Выложил v6 в бота, сварил и выложил GGUF, задавать как обычно через /setmodel. Уменьшил лимиты для opus и gpt-4o, послезавтра и вовсе по 5 сообщений оставлю. Тратить по 50-60$ в день всё-таки перебор, да и данных уже довольно много собралось. Для других (локальных) моделей лимитов пока нет.
В phi3 нашёл ошибку со спецтокенами, так что релиз откалдывается.
В phi3 нашёл ошибку со спецтокенами, так что релиз откалдывается.