IT之家 2 月 8 日消息,谷歌旗下人工智能研究實驗室 DeepMind 開發(fā)的人工智能系統(tǒng) AlphaGeometry2 在解決國際數學奧林匹克競賽(IMO)幾何問題方面取得了突破性進展,其表現甚至超過了平均金牌得主。
AlphaGeometry2 是 DeepMind 在今年 1 月發(fā)布的 AlphaGeometry 系統(tǒng)的改進版本。根據 DeepMind 研究人員最新發(fā)表的論文,該 AI 系統(tǒng)能夠解決過去 25 年國際數學奧林匹克競賽中 84% 的幾何問題。國際數學奧林匹克競賽是一項面向高中生的數學競賽,而 DeepMind 認為,發(fā)現解決復雜幾何問題(特別是歐幾里得幾何問題)的新方法可能是實現更強大人工智能的關鍵。
證明數學定理或邏輯解釋定理(例如勾股定理)為何成立,需要推理能力以及從多種可能的步驟中選擇解決方案的能力。如果 DeepMind 的觀點正確,這些解決問題的技能將成為未來通用人工智能模型的重要組成部分。
IT之家注意到,去年夏天,DeepMind 展示了一個將 AlphaGeometry2 與 AlphaProof(一種用于形式化數學推理的 AI 模型)相結合的系統(tǒng),成功解決了 2024 年國際數學奧林匹克競賽中的 6 個問題中的 4 個。除了幾何問題,類似的方法還可以擴展到數學和科學的其他領域,例如輔助復雜的工程計算。
AlphaGeometry2 包含幾個核心要素,其中包括谷歌 Gemini 系列 AI 模型中的語言模型和一個“符號引擎”。Gemini 模型協(xié)助符號引擎,后者利用數學規(guī)則推導問題的解決方案,并為給定的幾何定理提供可行的證明。
由于將證明轉化為 AI 可理解的格式存在復雜性,可用的幾何訓練數據匱乏。因此,DeepMind 為 AlphaGeometry2 的語言模型創(chuàng)建了自己的合成數據,生成了超過 3 億個不同復雜度的定理和證明。
研究團隊從過去 25 年(2000 年至 2024 年)的國際數學奧林匹克競賽中挑選了 45 個幾何問題,包括線性方程和需要在平面上移動幾何對象的方程,并將其“翻譯”成一個更大的 50 個問題的集合(由于技術原因,某些問題需要拆分為兩個)。根據論文,AlphaGeometry2 解決了其中的 42 個問題,超過了平均金牌得主40.9 的得分。
不過,該系統(tǒng)也存在局限性。一個技術問題導致 AlphaGeometry2 無法解決涉及可變數量點、非線性方程和不等式的問題。此外,盡管 AlphaGeometry2 不是第一個達到幾何問題金牌水平表現的 AI 系統(tǒng),但它是在如此規(guī)模的問題集上實現這一目標的首個系統(tǒng)。
在另一組更具挑戰(zhàn)性的國際數學奧林匹克競賽問題上,AlphaGeometry2 的表現也不盡如人意。DeepMind 團隊額外挑選了 29 個由數學專家為競賽提名但尚未出現在比賽中的問題,AlphaGeometry2 只能解決其中的 20 個。