Помоги LLM выбрать лучшие ответы.



На kaggle завезли соревку по задаче реранкинга генераций GPT-3.5. Нужно из топ-5 генераций выбрать топ-3 лучших в ранжированном виде. Метрика MAP@3, что логично. Домен "сложный научный". В обучении 200 пар)



В общем расчехляйте свои пайпы по созданию reward моделек. И вперёд за медальками.