在人工智能的歷史上,2024年9月12日或許將被銘記為一個歷史性轉(zhuǎn)折點。就在這一天,OpenAI宣布了其最新系列AI模型o1。據(jù)官方稱,o1是史上最聰明的模型,思考方式也更接近人類,標志著人類正在通往推理時代的新道路。
o1模型的核心在于其推理能力。與基于預(yù)測的模型不同,o1在回答問題之前會進行深入的思考,探索不同的路徑直到找到最佳答案。
這種能力使得o1能夠在給定更多的“思考”時間時,回答更難的問題,類似于在國際象棋比賽中關(guān)鍵時刻考慮可能的走法。這種推理能力是AI發(fā)展的一大步,它使得AI能夠在更廣泛的領(lǐng)域中應(yīng)用,包括但不限于編程、數(shù)學和科學問題。
普通用戶在日常使用中可能難以察覺o1模型與GPT系列之間的微妙差異,但對于深入研究AI技術(shù)的研究人員而言,這一變化卻是革命性的。
據(jù)《The Atlantic》上周文章,研究人員已經(jīng)認識到,與GPT等舊模型相比,o1模型不僅僅是一次簡單的升級,而是標志著一個“完全不同的游戲規(guī)則”和“真正的進步”。作為第一個具備真正通用推理能力的大模型,o1模型在處理復雜問題和推理任務(wù)時展現(xiàn)出的能力,或預(yù)示著人工智能技術(shù)的一個歷史性轉(zhuǎn)折點。
OpenAI研究副總裁Mark Chen今年早前指出,o1與標準 ChatGPT 有著根本的不同,因為它可以“推理”,這是人類智能的標志。此后不久,OpenAI首席執(zhí)行官Altman宣布“智能時代即將到來”,人工智能將幫助人類解決氣候問題并殖民太空。上周,這家初創(chuàng)公司向公眾發(fā)布了具有完全成熟推理能力的o1完整的第一代版本。
第一個具備真正通用推理能力的大模型
OpenAI稱,o1模型是第一個具備真正通用推理能力的大模型,這一點在測試化學、物理和生物學專業(yè)知識的基準GPQA-diamond上得到了充分體現(xiàn)。
根據(jù)OpenAI的評估,o1在該測試中全面超過了人類博士專家,準確率達到78.3%,而人類專家的得分為69.7%。OpenAI稱,“通用人工智能(AGI)之路,已經(jīng)沒有任何阻礙”。
此外,o1在多個高難度的推理基準測試中表現(xiàn)優(yōu)異,例如在美國數(shù)學邀請賽(AIME)中,o1的正確率達到了83.3%,遠超其前身GPT-4o的表現(xiàn)。
o1模型的推出,也使得國內(nèi)外的AI企業(yè)開始密切關(guān)注彼此的動態(tài),意圖在AI大模型領(lǐng)域?qū)崿F(xiàn)突破。市場涌現(xiàn)出一批新興的大模型,如kimi的k0math、Deepseek的DeepSeek-R1-Lite和昆侖萬維的“天工大模型4.0”o1版,它們在邏輯思維與深度推理的能力上,試圖與o1抗衡。
本文來自華爾街見聞,歡迎下載APP查看更多