8.19 у v4 Сайги на русском MT-Bench'е, то есть точно такая же оценка, как у Судзуме. Однако, обратите внимание на 8.68 в правом нижнем углу. Это оценки других моделей от авторов Судзуме.



Напомню, ORPO: https://arxiv.org/abs/2403.07691. Если оставить суть, то это как DPO, но не нужно хранить отдельную референсную модель в памяти.