老熟风间由美AV在线一区二区,国产A级免费黄片

o3 壓臺(tái)登場(chǎng)：OpenAI 卷動(dòng)推理 AI 模型風(fēng)云，邁向 AGI 新巔峰

來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-21 12:08:57 瀏覽：242次

導(dǎo)讀：IT之家 12 月 21 日消息，“12 Days of OpenAI”活動(dòng)已拉上帷幕，OpenAI 的 o3 系列大模型壓臺(tái)登場(chǎng)，官方稱在某些場(chǎng)景下，其推理能力非常接近通用人工智能（AGI）。名稱最新的 AI 模型為何跳過 o2，叫做 o3 呢？OpenAI 公司首席執(zhí)行官山姆·阿爾特曼（Sam Altman）在今天早上的直播活動(dòng)，表示是為了規(guī)避和英國(guó)電信運(yùn)營(yíng)商 O2 的商標(biāo)沖突。邀請(qǐng)安全測(cè)試o3 是 o1 推理模型的繼任者 ......

IT之家 12 月 21 日消息，“12 Days of OpenAI”活動(dòng)已拉上帷幕，OpenAI 的 o3 系列大模型壓臺(tái)登場(chǎng)，官方稱在某些場(chǎng)景下，其推理能力非常接近通用人工智能（AGI）。

名稱最新的 AI 模型為何跳過 o2，叫做 o3 呢？OpenAI 公司首席執(zhí)行官山姆·阿爾特曼（Sam Altman）在今天早上的直播活動(dòng)，表示是為了規(guī)避和英國(guó)電信運(yùn)營(yíng)商 O2 的商標(biāo)沖突。

邀請(qǐng)安全測(cè)試o3 是 o1 推理模型的繼任者，包含完整版和精簡(jiǎn)版（o3-mini），后者主要針對(duì)特定任務(wù)進(jìn)行了微調(diào)。

OpenAI 公司暫未完全開放 o3 和 o3-mini 兩款模型，即日起先邀請(qǐng)安全研究人員，注冊(cè)測(cè)試預(yù)覽版 o3-mini 模型，后續(xù)再推出 o3 預(yù)覽版。

o3 壓臺(tái)登場(chǎng)：OpenAI 卷動(dòng)推理 AI 模型風(fēng)云，邁向 AGI 新巔峰

現(xiàn)在，感興趣的朋友可以提交申請(qǐng)：https://openai.com/index/early-access-for-safety-testing/。

阿爾特曼并未公布 o3 模型的具體開放日期，僅透露 2025 年 1 月底推出 o3-mini，后續(xù)再推出 o3。

o3 模型推理OpenAI o3 模型和主流 AI 模型的一個(gè)最大不同點(diǎn)，在于會(huì)展開事實(shí)核查，從而可以規(guī)避一些常見的模型陷阱，但這個(gè)過程會(huì)產(chǎn)生響應(yīng)延遲，根據(jù)推理難度，通常是幾秒到幾分鐘。

o3 系列模型的另一個(gè)亮點(diǎn)是使用“私人思想鏈”（private chain of thought）進(jìn)行“思考”，它可以在響應(yīng)前暫停，考慮相關(guān)提示并解釋其推理過程，最終總結(jié)出最準(zhǔn)確的答案。

o3 的新功能之一是可以調(diào)整推理時(shí)間，分為低、中、高三種計(jì)算級(jí)別，計(jì)算級(jí)別越高，o3 的任務(wù)執(zhí)行性能越好。

性能和 AGIAGI 的全稱是 artificial general intelligence，直譯過來就是通用人工智能，泛指 AI 可以像人類一樣執(zhí)行任何任務(wù)，OpenAI 公司官方定義為“在最具經(jīng)濟(jì)價(jià)值的工作中超越人類的高度自治系統(tǒng)”。

OpenAI 公司正積極朝 AGI 目標(biāo)邁進(jìn)，除了鞏固其在 AI 領(lǐng)域的地位之外，還在投資領(lǐng)域有特別的含義。

根據(jù) OpenAI 與密切合作伙伴和投資者微軟的交易條款，一旦 OpenAI 達(dá)到 AGI，公司就不再有義務(wù)向微軟提供其最先進(jìn)的技術(shù)（即符合 OpenAI 的 AGI 定義的技術(shù)）。

而 o3 是 OpenAI 是邁向該目標(biāo)的重要一步，在 ARC-AGI 基準(zhǔn)測(cè)試中，o3 在高計(jì)算設(shè)置下獲得了 87.5% 的分?jǐn)?shù)，在低計(jì)算設(shè)置下得分為 75.7%，性能是 o1 的三倍。

ARC-AGI 聯(lián)合創(chuàng)始人 Franois Chollet 表示，誠(chéng)然高計(jì)算設(shè)置非常昂貴，每個(gè)任務(wù)要花費(fèi)數(shù)千美元。

o3 壓臺(tái)登場(chǎng)：OpenAI 卷動(dòng)推理 AI 模型風(fēng)云，邁向 AGI 新巔峰

IT之家援引該媒體報(bào)道，在其他基準(zhǔn)測(cè)試中，o3 表現(xiàn)出色：

在 SWE-Bench Verified 編程任務(wù)基準(zhǔn)測(cè)試中，o3 比 o1 高出 22.8 個(gè)百分點(diǎn)；

在 Codeforces 編程技能測(cè)試中，o3 獲得了 2727 的評(píng)分；

在 2024 年美國(guó)數(shù)學(xué)邀請(qǐng)賽中，o3 得分 96.7%；

在 GPQA Diamond 研究生水平生物、物理和化學(xué)測(cè)試中，o3 得分 87.7%；

在 EpochAI 的 Frontier Math 基準(zhǔn)測(cè)試中，o3 解決了 25.2% 的問題（其他模型均不超過 2%），創(chuàng)造了新紀(jì)錄。

o3 壓臺(tái)登場(chǎng)：OpenAI 卷動(dòng)推理 AI 模型風(fēng)云，邁向 AGI 新巔峰

這些結(jié)果來自 OpenAI 的內(nèi)部評(píng)估，需要等待外部客戶和機(jī)構(gòu)的基準(zhǔn)測(cè)試結(jié)果來進(jìn)一步驗(yàn)證。

安全o3 的發(fā)布標(biāo)志著 OpenAI 在通用人工智能領(lǐng)域邁出了重要一步。雖然 o3 的能力令人印象深刻，但其潛在風(fēng)險(xiǎn)也需要引起重視。OpenAI 承諾將致力于模型安全，并與其他機(jī)構(gòu)合作構(gòu)建更完善的基準(zhǔn)測(cè)試體系。

o3 壓臺(tái)登場(chǎng)：OpenAI 卷動(dòng)推理 AI 模型風(fēng)云，邁向 AGI 新巔峰
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-21 12:08:57 瀏覽：242次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

o3 壓臺(tái)登場(chǎng)：OpenAI 卷動(dòng)推理 AI 模型風(fēng)云，邁向 AGI 新巔峰 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-21 12:08:57 瀏覽：242次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

o3 壓臺(tái)登場(chǎng)：OpenAI 卷動(dòng)推理 AI 模型風(fēng)云，邁向 AGI 新巔峰
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-12-21 12:08:57 瀏覽：242次