震撼！DeepMind新AI系统AlphaGeometry2超越IMO金牌得主

字数 784，阅读大约需 4 分钟

AlphaGeometry2：超越国际数学奥林匹克金牌得主的DeepMind新AI系统

近日，谷歌DeepMind研究实验室推出AI系统AlphaGeometry2，其在解决几何问题方面能力卓越，表现超越国际数学奥林匹克（IMO）比赛中的平均金牌得主，为人工智能领域带来重要成果。

AlphaGeometry2的卓越表现

研究人员表示，AlphaGeometry2能解决过去25年IMO中84%的几何问题。研究团队从过去25年IMO的几何问题中挑选45个，并扩展形成50个问题集，AlphaGeometry2成功解决其中42个，远超金牌得主平均得分。2024年夏天，DeepMind展示结合AlphaGeometry2与数学推理AI模型AlphaProof的系统，该系统在2024年IMO的六个问题中解决四个。

为何聚焦IMO几何问题

DeepMind关注IMO这类高中数学竞赛有其原因。证明数学定理，如勾股定理，需强大逻辑推理能力和从多个可能步骤中做选择的能力。解决复杂几何问题，特别是欧几里得几何问题的新途径，对提升AI能力至关重要。《2024 – 2025全球人工智能数学应用趋势报告》指出，数学推理能力是当前AI从专用向通用发展的重要瓶颈之一，解决几何问题对突破这一瓶颈意义重大。

AlphaGeometry2的技术核心

AlphaGeometry2的核心组件有来自谷歌Gemini系列的语言模型和 “符号引擎”。Gemini模型^[1]协助符号引擎依据数学规则推导问题可行解决方案。在IMO几何问题中，常需基于图形添加 “构造”，如点、线或圆，AlphaGeometry2的Gemini模型能精准预测哪些构造有助于解决问题。AlphaGeometry2训练时，使用DeepMind自己生成的超3亿个定理和证明的合成数据。《人工智能训练数据发展蓝皮书（2024版）》统计表明，大量高质量训练数据可显著提升AI模型在特定领域的表现，AlphaGeometry2就是例证。

混合方法的运用与讨论

AlphaGeometry2采用混合方法，有机结合神经网络和基于规则的符号引擎。这种方式引发行业内关于AI系统应基于符号操作还是神经网络的讨论。虽AlphaGeometry2取得成功，但存在局限性，无法解决具有可变数量点、非线性方程和不等式的问题。不过，它为通用AI未来发展指明方向。《2025年全球通用人工智能发展展望》提到，未来AI发展将更注重多种技术融合，AlphaGeometry2的混合方法顺应这一趋势。