展會信息港展會大全

破壁者DeepSeek:普通人也能用,證明大模型≠大投入
來源:互聯(lián)網(wǎng)   發(fā)布日期:2025-02-10 16:48:19   瀏覽:211次  

導讀:春節(jié)過后,在整個新春期間刷屏的國產(chǎn)AI大模型DeepSeek卻始終維持著其霸榜的熱度。短短一周,國內(nèi)大模型公司“深度求索”開發(fā)的DeepSeek不僅拿下了美國和中國區(qū)App Store免費榜的雙料第一,還成為首個超越OpenAI ChatGPT的AI助手類應用。這個成立僅3年的中國團隊,其最新開源的DeepSeek-MoE-16B模型在MMLU基準測試中以87.3%準確率超越國外頂尖大模型ChatGPT-4,而訓練成本僅為后 ......

春節(jié)過后,在整個新春期間刷屏的國產(chǎn)AI大模型DeepSeek卻始終維持著其霸榜的熱度。短短一周,國內(nèi)大模型公司“深度求索”開發(fā)的DeepSeek不僅拿下了美國和中國區(qū)App Store免費榜的雙料第一,還成為首個超越OpenAI ChatGPT的AI助手類應用。

這個成立僅3年的中國團隊,其最新開源的DeepSeek-MoE-16B模型在MMLU基準測試中以87.3%準確率超越國外頂尖大模型ChatGPT-4,而訓練成本僅為后者的1/5,其優(yōu)秀的計算推理能力和廉價的訓練價格讓世界震驚,“原來大模型競賽不單單是屬于大公司的游戲。”

隨著春節(jié)期間越來越多普通人開始下載并深度使用DeepSeek,也讓世人驚呼,中國人自主開發(fā)的AI,終于在這個春天迎來了自己的“微信時刻”。

破壁者DeepSeek:普通人也能用,證明大模型≠大投入

何以彎道超車?

極客團隊的“巧力出奇跡”

去年12月, DeepSeek的V3版本在全球AI領域掀起了巨大的波瀾,它以極低的訓練成本,實現(xiàn)了與國際頂尖模型相媲美的性能,震驚了業(yè)界。北京郵電大學人工智能學院人機交互與認知工程實驗室主任劉偉在接受央視采訪時介紹,“DeepSeek最大的優(yōu)勢在于它算法的改進和優(yōu)化,它在算力上得到了節(jié)省,在輸入數(shù)據(jù)和語料庫上,不像以前要求那么大的數(shù)據(jù)量和大的算力,這是它的優(yōu)勢!

“以前如果說OpenAI是‘大力出奇跡’,那么DeepSeek就是‘巧力也可以出奇跡’!笨焖悸胙芯吭涸洪L田豐告訴南方+記者,自ChatGPT問世以來,在人工智能科研領域,全世界普遍遵循著大語言模型中的第一性原理:尺度定律。簡言之,算力越強,大模型越強。但是自去年年中以來,當技術迭代到ChatGPT4之后,由算力堆積的預訓練階段的尺度定律已經(jīng)進入性價比較低的階段,而DeepSeek則將精力放到底層技術棧的優(yōu)化和創(chuàng)新上。根據(jù)業(yè)界測算,DeepSeek能夠以美國公司Meta十分之一的成本實現(xiàn)相近的性能。

田豐特別提到,DeepSeek僅僅150人的團隊,顯示出非常純粹的基礎科研精神,類似于早期OpenAI團隊的極客精神。這也體現(xiàn)在DeepSeek的產(chǎn)品中:現(xiàn)在DeepSeek主要發(fā)布的三篇論文和三個產(chǎn)品R1、V2、V3,正是不同技術路線的三種嘗試。在外界看來,這個百余人的團隊除了在縱深上對于大量技術產(chǎn)生顛覆性重構(gòu)的同時,也在橫向上進行了廣泛的嘗試,這種大膽嘗試、小心驗證、快速迭代的能力也讓這支年輕團隊被業(yè)界贊嘆。

如何保持優(yōu)勢?

率先開源形成“護城河”

值得關注的是,DeepSeek采用了完全開源策略。DeepSeek創(chuàng)始人梁文鋒在接受科技媒體暗涌采訪時曾說過,“在顛覆性技術面前,閉源形成的護城河是暫時的。即使OpenAI 閉源,也無法阻止他人超越。因此,DeepSeek將價值沉淀在團隊建設上,通過不斷積累知識和創(chuàng)新文化,形成自身的競爭優(yōu)勢!

北京大學深圳研究生院副研究員胡國慶認為,開源的優(yōu)勢也意味著越來越多的開發(fā)者可以進來,更多開發(fā)者加入生態(tài),可以進一步降低開發(fā)建設的成本,同時逐步形成自己的生態(tài)。正如開源的安卓在很快時間就形成氣候一樣,生態(tài)構(gòu)建需要開發(fā)者八方合力。

美國Meta公司很快就要求團隊針對DeepSeek的路線進行拷貝重現(xiàn)。同時,國內(nèi)不少大模型也開始復制DeepSeek的路線。這是否意味著DeepSeek剛剛得來的頭把交椅會很快易主?

對此,田豐告訴記者,具有全球領先性的DeepSeek率先開源,形成了全球開發(fā)者的“虹吸效應”,即便后面OpenAI再開源,開發(fā)者投入DeepSeek的學習時間和開發(fā)資源都將成為開源競爭的護城河。

破壁者DeepSeek:普通人也能用,證明大模型≠大投入

田豐認為,媒體關注的所謂模型排名,只是科技創(chuàng)新競爭的表象。“如果仔細觀察來看,模型的算力、價格、排名幾乎每個月甚至每周都在變化。真正需要重視的則是科技創(chuàng)新的速度和加速度,倘若創(chuàng)新加速度領先,那就會在長跑中始終保持優(yōu)秀!

田豐介紹,由于DeepSeek是開放權重模型,且對下游基于該模型的商業(yè)開發(fā)沒有做出限制,論文中也透露出很多訓練細節(jié),屬于目前開放性最好的開源模型,超過了美國開源龍頭Meta的Llama系列模型,所以讓DeepSeek廣受開發(fā)者喜愛。

DeepSeek爆火之后,其鲇魚效應正在不斷發(fā)酵,各家AI巨頭開始紛紛效仿。OpenAI在大年初四推出了o3推理模型,隨后又免費開放了搜索功能;谷歌緊隨其后,Gemini2.0模型全面開放,而在2月7日,OpenAI則進一步打算跟進DeepSeek的“開放”戰(zhàn)略, 宣布公開最新模型o3-mini系列模型的思維鏈,讓用戶也能看到模型的思考過程。

為什么火出圈了?

迎來自己的“微信時刻”

先行者ChatGPT問世已超過兩年。這兩年里,國內(nèi)外多個大模型在各類排行榜中爭奪激烈,但其使用者往往還是小范圍的科技工作者、程序員等。普通人總覺得,好用的AI大模型距離太遠。

直到這次,針對普通用戶免費下載使用、回答有趣的DeepSeek,讓AI大模型首次在國內(nèi)走進千家萬戶。

田豐觀察到,春節(jié)期間,不單單是一線城市的開發(fā)者們,連四五線縣城的老人,都會用AI去查菜譜。正如媒體所言,大模型真正來到了人人可用的“微信時代”。

“四五線城市的很多用戶連DeepSeek這個英文名字都不會念,但是他知道一個D打頭的AI很厲害,就會下載這個應用!碧镓S說。

春節(jié)期間,不少網(wǎng)友在社交網(wǎng)絡上曬出自己與DeepSeek對話的截圖,有護士希望在有限的時間讓AI教自己如何賺外快,有人希望AI幫自己安排過年走親戚的規(guī)劃,還有人貼出AI給出的新年投資計劃,并感慨“像大師的水平”……

田豐覺得,DeepSeek的一個亮點在于,其在給出結(jié)論的同時,還把它的“思維過程”寫出來了,“這對于用戶來說是非常友好的,可以看到這個AI是怎么一步一步推導出結(jié)論的,有新意,這是之前很多模型都沒有打開的‘黑盒’。”田豐以自身為例說,“我就比較喜歡,不光看結(jié)果,更喜歡看它的推導過程!

破壁者DeepSeek:普通人也能用,證明大模型≠大投入

會帶來新的變革嗎?

AI產(chǎn)業(yè)有望從燒錢轉(zhuǎn)向賺錢

“我相信在最近兩個月內(nèi),有很多基于DeepSeek的行業(yè)模型,會有明顯的臺階式的性能提升!碧镓S說。他以ChatGPT為例介紹,當ChatGPT4版本發(fā)布后,得益于這一版本邏輯推理能力的提升,使得AI編程達到了商業(yè)化需求的基準線。相應地,DeepSeek因其優(yōu)秀的邏輯推理能力,在醫(yī)療、科研、金融、編程等領域有望實現(xiàn)商業(yè)應用。

胡國慶也分析,可以預見兩到三年內(nèi),各種細分領域的AI產(chǎn)品,包括AI大模型、AI終端甚至AI機器人等將不斷融入各行各業(yè),各種細分品類的大模型也將不斷涌現(xiàn)。

在田豐看來,DeepSeek對于各個行業(yè)的影響仍在不斷發(fā)酵,但有一點毋庸置疑,那就是創(chuàng)新的信心:“此前,美國的壟斷讓人們誤以為在這場競賽中他人已毫無機會,而DeepSeek的這次突圍,就給了所有人信心。

他表示,DeepSeek帶來了巨大的希望:之前不管是美國還是中國的大公司,大模型都是幾千人在做,投入的算力至少是幾萬張顯卡,10萬張卡、20萬張卡甚至更高。但DeepSeek出現(xiàn)后,大家會發(fā)現(xiàn)原來用5萬張卡,150人青年科學家的團隊,就可以把這個世界領先的模型做出來。

他進一步表示,之前大家一直說AI是在不斷地燒錢,現(xiàn)在因為基礎模型和算力帶來的成本持續(xù)的下降,AI大模型有望到達成本拐點,也即從燒錢轉(zhuǎn)變?yōu)橘嶅X,從而帶來產(chǎn)業(yè)應用的繁榮。

由此,上游的云計算、基礎模型廠商、芯片廠商都會從商業(yè)利潤中受益!坝脩粼敢鉃榇竽P偷膽萌ジ顿M了,整個的商業(yè)模式就通了,之后不管是算力層面還是芯片研發(fā)層面,和原來只是靠投資或者國家的大基金支持又會不一樣,它將會有非常好的商業(yè)良性循環(huán)!碧镓S說。

按照DeepSeek該團隊過去每季度推出新版本的節(jié)奏,相信今年春天我們就可以看到更強的DeepSeek。越強的模型必然帶來越加繁榮的人工智能應用市場,而市場的利潤最終也將再次回流到研發(fā)?梢灶A見,一個屬于AI的春天已經(jīng)來了。

南方日報記者 徐勉 王詩

南方日報、南方+客戶端原創(chuàng),未經(jīng)授權不得轉(zhuǎn)載

編輯 余佩 李江萍

校對 黃買冰

贊助本站

相關內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港