Старший Авгур
Я собрал тест-сет из 230 примеров запросов из бота, попробовал разные варианты LLM-as-a-Judge, всё д...
Читать далее
Ещё один вопрос, на который отвечают только топовые проприетарные модели.
Читать далее
Закончил размечать новые данные, в итоге вышло 1600 примеров, отправил их в стандартный пайплайн (оц...
Читать далее
Вопрос, достойный задавания языковым моделям (отвечает Sonnet 3.5)
Читать далее
Сделал маленькую консольную программку на Textual для ручной фильтрации датасета. Напрямую читать JS...
Читать далее
CoT вариант 3.5 Sonnet'а (смотрю https://www.youtube.com/watch?v=yBL7J0kgldU, там как раз про похоже...
Читать далее
Для полноты — gpt-4o просто выдумал цитату, что по-моему гораздо хуже.
Читать далее
Интересный пример ответа 3.5 Sonnet'а. Во-первых, он дословно помнит отрывок из Мастера и Маргариты....
Читать далее
Интересный пример ответа 3.5 Sonnet'а. Во-первых, он дословно помнит отрывок из Мастера и Маргариты....
Читать далее