Результаты последних попыток. Qwen2 7b вполне приличен, но не лучше Лламы. Abliterated модели в качестве не сильно теряют, но у меня пока не получается добиться одновременно и нормального скора, и нормальной длины ответов.