На основе Gemini 2.0 Flash выпустили thinking модель, которая улетела вверх по бенчмаркам:



- Overall: #3 → #1

- Overall (Style Control): #4 → #1

- Math: #2 → #1

- Creative Writing: #2 → #1

- Hard Prompts: #1 → #1 (+14 pts)

- Vision: #1 → #1 (+16 pts)



Всего 32к контекста, зато бесплатно через AI Studio. В отличие от конкурентов, видно внутренний chain of thought. 😛