展會信息港展會大全

谷歌DeepMind AI系統(tǒng)展現超強幾何解題能力
來源:互聯(lián)網   發(fā)布日期:2025-02-08 08:12:19   瀏覽:175次  

導讀:IT之家 2 月 8 日消息,谷歌旗下人工智能研究實驗室 DeepMind 開發(fā)的人工智能系統(tǒng) AlphaGeometry2 在解決國際數學奧林匹克競賽(IMO)幾何問題方面取得了突破性進展,其表現甚至超過了平均金牌得主。AlphaGeometry2 是 DeepMind 在今年 1 月發(fā)布的 AlphaGeometry 系統(tǒng)的改進版本。根據 DeepMind 研究人員最新發(fā)表的論文,該 AI 系統(tǒng)能夠解決過去 25 年國際數學奧林匹克競賽中 8 ......

IT之家 2 月 8 日消息,谷歌旗下人工智能研究實驗室 DeepMind 開發(fā)的人工智能系統(tǒng) AlphaGeometry2 在解決國際數學奧林匹克競賽(IMO)幾何問題方面取得了突破性進展,其表現甚至超過了平均金牌得主。

谷歌DeepMind AI系統(tǒng)展現超強幾何解題能力

AlphaGeometry2 是 DeepMind 在今年 1 月發(fā)布的 AlphaGeometry 系統(tǒng)的改進版本。根據 DeepMind 研究人員最新發(fā)表的論文,該 AI 系統(tǒng)能夠解決過去 25 年國際數學奧林匹克競賽中 84% 的幾何問題。國際數學奧林匹克競賽是一項面向高中生的數學競賽,而 DeepMind 認為,發(fā)現解決復雜幾何問題(特別是歐幾里得幾何問題)的新方法可能是實現更強大人工智能的關鍵。

谷歌DeepMind AI系統(tǒng)展現超強幾何解題能力

證明數學定理或邏輯解釋定理(例如勾股定理)為何成立,需要推理能力以及從多種可能的步驟中選擇解決方案的能力。如果 DeepMind 的觀點正確,這些解決問題的技能將成為未來通用人工智能模型的重要組成部分。

IT之家注意到,去年夏天,DeepMind 展示了一個將 AlphaGeometry2 與 AlphaProof(一種用于形式化數學推理的 AI 模型)相結合的系統(tǒng),成功解決了 2024 年國際數學奧林匹克競賽中的 6 個問題中的 4 個。除了幾何問題,類似的方法還可以擴展到數學和科學的其他領域,例如輔助復雜的工程計算。

AlphaGeometry2 包含幾個核心要素,其中包括谷歌 Gemini 系列 AI 模型中的語言模型和一個“符號引擎”。Gemini 模型協(xié)助符號引擎,后者利用數學規(guī)則推導問題的解決方案,并為給定的幾何定理提供可行的證明。

由于將證明轉化為 AI 可理解的格式存在復雜性,可用的幾何訓練數據匱乏。因此,DeepMind 為 AlphaGeometry2 的語言模型創(chuàng)建了自己的合成數據,生成了超過 3 億個不同復雜度的定理和證明。

研究團隊從過去 25 年(2000 年至 2024 年)的國際數學奧林匹克競賽中挑選了 45 個幾何問題,包括線性方程和需要在平面上移動幾何對象的方程,并將其“翻譯”成一個更大的 50 個問題的集合(由于技術原因,某些問題需要拆分為兩個)。根據論文,AlphaGeometry2 解決了其中的 42 個問題,超過了平均金牌得主40.9 的得分。

不過,該系統(tǒng)也存在局限性。一個技術問題導致 AlphaGeometry2 無法解決涉及可變數量點、非線性方程和不等式的問題。此外,盡管 AlphaGeometry2 不是第一個達到幾何問題金牌水平表現的 AI 系統(tǒng),但它是在如此規(guī)模的問題集上實現這一目標的首個系統(tǒng)。

在另一組更具挑戰(zhàn)性的國際數學奧林匹克競賽問題上,AlphaGeometry2 的表現也不盡如人意。DeepMind 團隊額外挑選了 29 個由數學專家為競賽提名但尚未出現在比賽中的問題,AlphaGeometry2 只能解決其中的 20 個。

贊助本站

相關內容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港