Международная Олимпиада по математике — престижное состязание для старшеклассников, в котором участвуют лучшие ученики из более 100 стран.
Новая модель AlphaGeometry2 от Google DeepMind решила 84% всех геометрических задач с олимпиады, заданных в последние 25 лет, побив средний результат золотых медалистов соревнования — 81,8%. Предыдущая версия модели справлялась лишь с 54% заданий. К слову, ни OpenAI o1, ни Gemini Thinking не смогли решить ни одной задачи.
📐 Чем интересна AlphaGeometry2
AlphaGeometry сочетает в себе несколько ИИ-архитектур. Первая часть модели — нейросеть на базе Gemini, обученная на 300 млн синтетических теорем, анализирует условия задачи и предлагает идеи для вспомогательных построений. Вторая — дедуктивный модуль, который проверяет гипотезы и делает выводы, шаг за шагом приближая модель к решению, отсеивая галлюцинации.
При этом оба модуля постоянно обмениваются информацией. Это напоминает работу нашего мозга в двух режимах: один отвечает за быстрые и интуитивные идеи, а другой — за кропотливое логическое мышление.
Как и математики-люди, AlphaGeometry2 обладает пространственным мышлением и вникает в логику теорем. При этом, отмечают эксперты Google DeepMind, ИИ показывает «сверхчеловеческую креативность», предлагая нетипичные и элегантные решения сложных задач.
Как минимум, такие модели могут стать основой нового поколения ИИ-репетиторов, способных объяснять ученикам суть решения любой задачи. Однако наделение ИИ возможностью погружаться в абстракции такого уровня, как нестандартные геометрические теоремы, может помочь алгоритмам овладеть «человеческой логикой», что приближает нас к созданию продвинутых моделей общего назначения.