展會信息港展會大全

BBC 研究:AI 聊天機(jī)器人總結(jié)新聞錯誤百出,分不清事實(shí)和觀點(diǎn)
來源:互聯(lián)網(wǎng)   發(fā)布日期:2025-02-12 11:57:58   瀏覽:128次  

導(dǎo)讀:IT之家 2 月 12 日消息,英國廣播公司(BBC)近期開展了一項(xiàng)大規(guī)模研究,旨在評估人工智能(AI)聊天機(jī)器人在新聞總結(jié)方面的表現(xiàn)。研究涉及了微軟的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI 工具。然而,研究結(jié)果顯示,這些工具在生成新聞總結(jié)時(shí)存在大量準(zhǔn)確性問題。研究中,BBC 讓這些 AI 工具對 100 篇新聞報(bào)道進(jìn)行總結(jié),并基于總結(jié)提出內(nèi) ......

IT之家 2 月 12 日消息,英國廣播公司(BBC)近期開展了一項(xiàng)大規(guī)模研究,旨在評估人工智能(AI)聊天機(jī)器人在新聞總結(jié)方面的表現(xiàn)。研究涉及了微軟的 Copilot、OpenAI 的 ChatGPT、谷歌的 Gemini 以及 Perplexity 等多款知名 AI 工具。然而,研究結(jié)果顯示,這些工具在生成新聞總結(jié)時(shí)存在大量準(zhǔn)確性問題。

BBC 研究:AI 聊天機(jī)器人總結(jié)新聞錯誤百出,分不清事實(shí)和觀點(diǎn)

研究中,BBC 讓這些 AI 工具對 100 篇新聞報(bào)道進(jìn)行總結(jié),并基于總結(jié)提出內(nèi)容相關(guān)問題。結(jié)果顯示,AI 生成的答案中有超過一半存在“顯著問題”,其中約五分之一的答案引入了明顯的事實(shí)錯誤,這些錯誤包括數(shù)據(jù)、陳述和日期等關(guān)鍵信息。BBC 新聞與時(shí)事首席執(zhí)行官德博拉·特內(nèi)斯(Deborah Turness)指出:“AI 助手在引用 BBC 文章內(nèi)容時(shí),超過十分之一的‘引文’被篡改或根本不存在于原文中!

此外,研究還發(fā)現(xiàn),AI 助手在新聞總結(jié)時(shí)無法區(qū)分事實(shí)與觀點(diǎn),也無法辨別新聞報(bào)道中當(dāng)下的信息和歷史存檔的信息,在給出答案的時(shí)候還容易摻入主觀的觀點(diǎn)。特內(nèi)斯表示:“這些 AI 工具所生成的結(jié)果往往是各種問題的混合體,與消費(fèi)者所期望的經(jīng)過驗(yàn)證的事實(shí)和清晰性相去甚遠(yuǎn)!

值得注意的是,BBC 的研究還發(fā)現(xiàn),微軟的 Copilot 和谷歌的 Gemini 在處理新聞總結(jié)時(shí)出現(xiàn)了更復(fù)雜的問題,相較于 ChatGPT 和 Perplexity,它們在區(qū)分觀點(diǎn)與事實(shí)、編輯化處理以及遺漏關(guān)鍵背景信息方面表現(xiàn)不佳。

IT之家注意到,AI 工具的準(zhǔn)確性問題并非僅限于這些聊天機(jī)器人。蘋果公司近期也因旗下 Apple Intelligence 通知工具分享錯誤標(biāo)題而引發(fā)爭議,導(dǎo)致其暫時(shí)停用該功能,并遭到新聞機(jī)構(gòu)和自由團(tuán)體的批評。

BBC 呼吁,在與 AI 服務(wù)提供商進(jìn)行深入對話并找到解決方案之前,應(yīng)暫停使用 AI 生成的新聞總結(jié)。特內(nèi)斯表示:“我們希望通過合作,共同尋找解決辦法!

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會 | 展會港