Ладно, забейте. Это всё очень интересно, но простое усреднение Sonnet'а и gpt-4o даёт 0.67 😳



Так что эти все сложные ансамбли не имеют смысла.