展會(huì)信息港展會(huì)大全

DeepSeek啟示錄:決定未來AI走向的三大議題
來源:互聯(lián)網(wǎng)   發(fā)布日期:2025-02-07 07:19:30   瀏覽:172次  

導(dǎo)讀:(來源:MIT Technology Review)通常,一款新 AI 模型的發(fā)布不會(huì)在科技圈外引起太大轟動(dòng),更不會(huì)讓股市因?yàn)榭只哦鴵p失上萬億美元,但 DeepSeek 是個(gè)例外。幾周前,DeepSeek 引起了巨大轟動(dòng),現(xiàn)在熱度稍微降了下來,媒體開始轉(zhuǎn)向其他新聞話題,比如美國(guó)聯(lián)邦政策的變化、清理研究數(shù)據(jù)以符合最新行政命令的要求,以及特朗普對(duì)加拿大、墨西哥等國(guó)家關(guān)稅政策可能帶來的影響等。那么 ......

DeepSeek啟示錄:決定未來AI走向的三大議題

(來源:MIT Technology Review)

通常,一款新 AI 模型的發(fā)布不會(huì)在科技圈外引起太大轟動(dòng),更不會(huì)讓股市因?yàn)榭只哦鴵p失上萬億美元,但 DeepSeek 是個(gè)例外。

幾周前,DeepSeek 引起了巨大轟動(dòng),現(xiàn)在熱度稍微降了下來,媒體開始轉(zhuǎn)向其他新聞話題,比如美國(guó)聯(lián)邦政策的變化、清理研究數(shù)據(jù)以符合最新行政命令的要求,以及特朗普對(duì)加拿大、墨西哥等國(guó)家關(guān)稅政策可能帶來的影響等。

那么,DeepSeek 在人工智能領(lǐng)域會(huì)帶來哪些長(zhǎng)遠(yuǎn)的影響呢?新聞熱度降溫之后,以下是值得關(guān)注的三個(gè)議題。

AI 的能耗問題

首先,DeepSeek 的出現(xiàn)讓業(yè)界重新審視人工智能的能耗問題,即人工智能模型在追求更佳答案的同時(shí)應(yīng)該消耗多少能源才是最合理的。

想必大家已經(jīng)有所耳聞 DeepSeek 非常高效節(jié)能,這在其訓(xùn)練階段確實(shí)如此,然而在推理階段,也就是當(dāng)你向模型提問并期待得到答案時(shí),情況就變得復(fù)雜起來了。

DeepSeek 采用了一種“思維鏈”技術(shù),將復(fù)雜的問題(例如是否可以為了保護(hù)某人的感情而撒謊)分解成一系列小問題然后逐個(gè)擊破。這種方法使得像 DeepSeek 這樣的模型在數(shù)學(xué)、邏輯、編程等方面表現(xiàn)亮眼。

然而,這種“思維鏈”方式可能會(huì)比其他常見的人工智能模型消耗更多電力。盡管目前人工智能的能耗僅占全球總排放量的一小部分,但隨著其應(yīng)用越來越廣泛,這個(gè)問題也將變得不容忽視。

我們需要考慮的是,是否所有的任務(wù)都值得這么高的能源消耗?而這取決于我們使用人工智能的目的,比如,為治療嚴(yán)重疾病進(jìn)行的醫(yī)療研究是非常值得的,但生成無意義的內(nèi)容則不然。

一些業(yè)內(nèi)專家擔(dān)心,DeepSeek 的卓越性能促使大量公司將其整合到眾多應(yīng)用程序和設(shè)備中,這可能會(huì)導(dǎo)致終端用戶在各種情景下頻繁進(jìn)行調(diào)用,進(jìn)而帶來不必要的資源浪費(fèi)。比如,讓 DeepSeek 解釋愛因斯坦的相對(duì)論完全就是一種浪費(fèi),因?yàn)檫@根本不需要邏輯推理步驟,任何一個(gè)普通的 AI 聊天模型(甚至網(wǎng)絡(luò)搜索)都能更快且更節(jié)能地完成任務(wù)。

脫離人工反饋訓(xùn)練模型

其次,DeepSeek 在其訓(xùn)練方法上的創(chuàng)新也值得注意,這可能會(huì)被其他公司效仿。

先進(jìn)的人工智能模型不僅僅依賴大量文本、圖像和視頻來學(xué)習(xí),它們還非常依賴人類工作者來清洗這些數(shù)據(jù)、對(duì)其進(jìn)行標(biāo)注,以及幫助模型選擇更佳的答案。

人類工作者參與其中的一種方式是通過“基于人類反饋的強(qiáng)化學(xué)習(xí)(RLHF)”,這是一種將傳統(tǒng)強(qiáng)化學(xué)習(xí)方法與人類反饋相結(jié)合的技術(shù)。模型生成一個(gè)答案,人類工作者對(duì)該答案進(jìn)行評(píng)分,然后利用這些評(píng)分來改進(jìn)模型。起初 OpenAI 率先使用了這項(xiàng)技術(shù),現(xiàn)如今它已被業(yè)界廣泛使用。

正如此前所報(bào)道的那樣,DeepSeek 采用了不同的方法,它嘗試一種自動(dòng)化評(píng)分和強(qiáng)化學(xué)習(xí)過程的方法!疤^或減少人類反饋是一件大事,這幾乎完全是在脫離了人工反饋的情況下訓(xùn)練模型。”阿里巴巴前研究總監(jiān)、以色列 AI 編碼初創(chuàng)公司 Qodo 的聯(lián)合創(chuàng)始人兼首席執(zhí)行官 Itamar Friedman 表示。

這種方法在數(shù)學(xué)、編程等領(lǐng)域特別有效,但在其他領(lǐng)域則效果不佳,因此仍然需要依賴人類工作者。即便如此,DeepSeek 并沒有止步于此,他們采用了類似 2016 年谷歌 DeepMind 訓(xùn)練 AI 模型以精通圍棋的方法來進(jìn)一步提升和優(yōu)化技術(shù)。

就像訓(xùn)練 AI 預(yù)測(cè)棋局的各種可能動(dòng)作及結(jié)果一樣,DeepSeek 也讓其系統(tǒng)學(xué)會(huì)了評(píng)估不同的選項(xiàng)并預(yù)測(cè)結(jié)果。由于這些技術(shù)創(chuàng)新已經(jīng)被記錄在 DeepSeek 的開源文檔中,其他公司很可能會(huì)跟進(jìn)和效仿。

開源還是閉源?

最后,DeepSeek 的成功激發(fā)了關(guān)于人工智能研究是否應(yīng)開源的重要辯論。

早在 DeepSeek 免費(fèi)發(fā)布其模型之前,一些 AI 公司就已經(jīng)主張?jiān)撔袠I(yè)需要公開透明。他們認(rèn)為,如果研究人員遵循某些開源原則并展示他們的工作成果,那么全球開發(fā)超級(jí)人工智能的競(jìng)賽就可以被視為一項(xiàng)為公眾利益而開展的科學(xué)研究項(xiàng)目,任何一個(gè)參與者的權(quán)力都會(huì)受到其他參與者的制衡。

這是一個(gè)美好的愿景,Meta 在很大程度上支持這一愿景。風(fēng)險(xiǎn)投資家 Marc Andreessen 也表示,“開源方法比政府監(jiān)管更能有效地保護(hù)人工智能的安全!

而 OpenAI 則持相反觀點(diǎn),認(rèn)為模型閉源有助于防止被不法分子利用?紤]到 OpenAI 過往的立場(chǎng),其首席執(zhí)行官奧爾特曼在上周五 Reddit 問答互動(dòng)中的表態(tài)令人驚訝,“在這一點(diǎn)上,我們站在了歷史錯(cuò)誤的一邊,我們需要找到不同的開源策略。”他說道。

包括特朗普總統(tǒng)在內(nèi)的很多人則強(qiáng)調(diào),“需要進(jìn)一步加強(qiáng)美國(guó)在人工智能領(lǐng)域的競(jìng)爭(zhēng)力,將 DeepSeek 的成功視為一個(gè)警鐘!

Anthropic 創(chuàng)始人兼首席執(zhí)行官 Dario Amodei 表示,“這也提醒我們,需要嚴(yán)格控制未來幾年哪些類型的先進(jìn)芯片出口到中國(guó)。”同時(shí),一些立法者也支持類似的觀點(diǎn)。

接下來的幾個(gè)月,隨著更多基于 DeepSeek 的技術(shù)和產(chǎn)品問世,這些問題將會(huì)得到進(jìn)一步探討和驗(yàn)證。

原文鏈接:

https://www.technologyreview.com/2025/02/04/1110918/three-things-to-know-as-the-dust-settles-from-deepseek/

贊助本站

相關(guān)熱詞: deepseek 特朗普 deep seek 啟示錄

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港