字数 784,阅读大约需 4 分钟
![谷歌DeepMind 震撼!DeepMind新AI系统AlphaGeometry2超越IMO金牌得主](https://aimgsgoheap.codexiu.cn/2025/01/image-2025-01-07-veo2-deepmind-google-.webp)
AlphaGeometry2:超越国际数学奥林匹克金牌得主的DeepMind新AI系统
近日,谷歌DeepMind研究实验室推出AI系统AlphaGeometry2,其在解决几何问题方面能力卓越,表现超越国际数学奥林匹克(IMO)比赛中的平均金牌得主,为人工智能领域带来重要成果。
AlphaGeometry2的卓越表现
研究人员表示,AlphaGeometry2能解决过去25年IMO中84%的几何问题。研究团队从过去25年IMO的几何问题中挑选45个,并扩展形成50个问题集,AlphaGeometry2成功解决其中42个,远超金牌得主平均得分。2024年夏天,DeepMind展示结合AlphaGeometry2与数学推理AI模型AlphaProof的系统,该系统在2024年IMO的六个问题中解决四个。
为何聚焦IMO几何问题
DeepMind关注IMO这类高中数学竞赛有其原因。证明数学定理,如勾股定理,需强大逻辑推理能力和从多个可能步骤中做选择的能力。解决复杂几何问题,特别是欧几里得几何问题的新途径,对提升AI能力至关重要。《2024 – 2025全球人工智能数学应用趋势报告》指出,数学推理能力是当前AI从专用向通用发展的重要瓶颈之一,解决几何问题对突破这一瓶颈意义重大。
AlphaGeometry2的技术核心
AlphaGeometry2的核心组件有来自谷歌Gemini系列的语言模型和 “符号引擎”。Gemini模型[1]协助符号引擎依据数学规则推导问题可行解决方案。在IMO几何问题中,常需基于图形添加 “构造”,如点、线或圆,AlphaGeometry2的Gemini模型能精准预测哪些构造有助于解决问题。AlphaGeometry2训练时,使用DeepMind自己生成的超3亿个定理和证明的合成数据。《人工智能训练数据发展蓝皮书(2024版)》统计表明,大量高质量训练数据可显著提升AI模型在特定领域的表现,AlphaGeometry2就是例证。
混合方法的运用与讨论
AlphaGeometry2采用混合方法,有机结合神经网络和基于规则的符号引擎。这种方式引发行业内关于AI系统应基于符号操作还是神经网络的讨论。虽AlphaGeometry2取得成功,但存在局限性,无法解决具有可变数量点、非线性方程和不等式的问题。不过,它为通用AI未来发展指明方向。《2025年全球通用人工智能发展展望》提到,未来AI发展将更注重多种技术融合,AlphaGeometry2的混合方法顺应这一趋势。