展會信息港展會大全

OpenAI 借 Reddit 論壇測試 AI 說服能力,太強可能會帶來危險
來源:互聯網   發(fā)布日期:2025-02-04 18:04:44   瀏覽:140次  

導讀:IT之家 2 月 3 日消息,OpenAI 在其最新發(fā)布的“推理”模型 o3-mini 的系統文檔中透露,該公司利用 Reddit 的子論壇 r / ChangeMyView 來測試其 AI 模型的說服能力。r / ChangeMyView 是一個擁有數百萬用戶的 Reddit 論壇,用戶在此發(fā)布觀點并希望通過討論了解他人的不同看法。其他用戶則會以具有說服力的論點回應,試圖改變原帖作者的觀點。對于 OpenAI 等科技公司而言,r / C ......

IT之家 2 月 3 日消息,OpenAI 在其最新發(fā)布的“推理”模型 o3-mini 的系統文檔中透露,該公司利用 Reddit 的子論壇 r / ChangeMyView 來測試其 AI 模型的說服能力。r / ChangeMyView 是一個擁有數百萬用戶的 Reddit 論壇,用戶在此發(fā)布觀點并希望通過討論了解他人的不同看法。其他用戶則會以具有說服力的論點回應,試圖改變原帖作者的觀點。

OpenAI 借 Reddit 論壇測試 AI 說服能力,太強可能會帶來危險

對于 OpenAI 等科技公司而言,r / ChangeMyView 等 Reddit 論壇是高質量人類生成數據的寶庫,可用于訓練 AI 模型。OpenAI 表示,其從 r / ChangeMyView 收集用戶帖子,并要求 AI 模型在封閉環(huán)境中撰寫回復,以試圖改變 Reddit 用戶對某一主題的看法。隨后,OpenAI 將這些回復展示給測試者進行評估,并將 AI 模型的回復與人類回復進行比較,以衡量其說服力。

盡管 OpenAI 與 Reddit 達成了內容授權協議,允許其使用 Reddit 用戶帖子進行訓練并在其產品中展示這些內容,但 OpenAI 表示,此次基于 r / ChangeMyView 的評估與其 Reddit 協議無關。目前尚不清楚 OpenAI 如何獲取該子論壇的數據,且該公司表示暫無計劃向公眾發(fā)布這一評估結果。

值得注意的是,Reddit 近年來與多家 AI 公司達成了授權協議,但也曾公開批評部分 AI 公司未經許可抓取其網站內容。Reddit 首席執(zhí)行官史蒂夫·霍夫曼去年曾表示,微軟、Anthropic 和 Perplexity 等公司拒絕與其談判,并稱阻止這些公司抓取數據“非常麻煩”。此外,OpenAI 也因涉嫌未經授權抓取《紐約時報》等網站內容以訓練 ChatGPT 及其底層 AI 模型而面臨多起訴訟。

IT之家注意到,在 r / ChangeMyView 基準測試中,o3-mini 的表現并未顯著優(yōu)于或劣于 o1 或 GPT-4o。然而,OpenAI 的最新 AI 模型在說服力方面似乎超過了 r / ChangeMyView 子論壇中的大多數用戶。OpenAI 在 o3-mini 的系統文檔中表示:“GPT-4o、o3-mini 和 o1 均展現出強大的說服性論證能力,處于人類前 80-90% 的水平。目前,我們尚未發(fā)現模型表現遠超人類或具備明顯的超人類能力!

OpenAI 的目標并非開發(fā)具有超強說服力的 AI 模型,而是確保 AI 模型不會變得過于具有說服力。隨著推理模型在說服和欺騙方面表現越來越出色,OpenAI 已開發(fā)出新的評估方法和保障措施來應對這一問題。OpenAI 擔心,如果 AI 模型過于擅長說服人類用戶,可能會帶來危險。理論上,這可能導致高級 AI 按照自己的目標或者其控制者的目標行動,而不一定符合人類的整體利益。

盡管 OpenAI 已抓取了大部分公共互聯網數據并通過授權獲取其他數據,但 r / ChangeMyView 基準測試表明,AI 模型開發(fā)者仍在努力尋找高質量數據集來測試其模型。然而,獲取這些數據并非易事。

贊助本站

相關內容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港