文/王新喜
DeepSeek的沖擊效應(yīng)下,ChatGPT首席執(zhí)行官奧爾特曼首次承認(rèn)了,DeepSeek可與ChatGPT相媲美。
奧爾特曼直言,他對新挑戰(zhàn)者的出現(xiàn)并不感到意外,但DeepSeek出現(xiàn)的時機確實讓他大吃一驚。
現(xiàn)在DeepSeek在國外攪動風(fēng)云的同時,在國內(nèi)的一系列布局在快速推進(jìn),各大廠商紛紛接入deepSeek,國產(chǎn)芯片與 AI 大模型的融合發(fā)展正步入快車道。除龍芯中科外,華為騰、沐曦等多家國產(chǎn)芯片企業(yè)也相繼宣布適配或上架 DeepSeek 模型服務(wù)。
deepSeek對國內(nèi)最大的利好是降低了對高算力芯片的需求。國產(chǎn)算力芯片開始供不應(yīng)求,摩爾線程、華為騰出貨量都在漲。阿里云和騰訊云也悄悄地從英偉達(dá)轉(zhuǎn)向了國產(chǎn)芯片。
值得一提的是,華為與DeepSeek的合作,堪稱國產(chǎn)AI領(lǐng)域的“核彈級”爆炸,而雙方針對騰芯片的特性,對DeepSeek模型架構(gòu)進(jìn)行了深度優(yōu)化,重構(gòu)了AI模型的計算流程,讓算法與硬件實現(xiàn)了高度適配,國產(chǎn)芯片與 AI 大模型的融合發(fā)展正步入快車道。
春節(jié)假期間,DeepSeek用戶量激增十幾倍不止,但由于推理集群準(zhǔn)備不足,部分功能被迫關(guān)閉。
為滿足用戶需求,推理端算力部署在加速推進(jìn)。隨著MaaS廠商紛紛接入DeepSeek模型,基于DeepSeek的衍生版本和下游AI應(yīng)用將迎來爆發(fā)式增長,推理端算力需求將持續(xù)攀升。DeepSeek已開始布局多模態(tài)AI,其算力消耗是文本模型的10倍以上。對國產(chǎn)算力板卡(如騰910B/910C)的需求將大幅提升。
眾所周知,與英偉達(dá)的高端芯片A100相比,華為算力芯片確實還差一個檔次。
在過去堆算力發(fā)展AI大力出奇跡的模式下,算力直接關(guān)系到數(shù)據(jù)處理分析能力以及人工智能模型的開發(fā)水準(zhǔn)。這也是一直以來國內(nèi)AI被卡脖子的關(guān)鍵環(huán)節(jié)。
但盡管如此,由于對國產(chǎn)替代的需求增長,2024年第四季度,騰在中國AI芯片市場的份額從3%飆升至27%,而英偉達(dá)的份額則從95%暴跌至58%。
但現(xiàn)在,DeepSeek的橫空出世,加速了國產(chǎn)算力芯片的替代進(jìn)程,deepSeek R1大模型訓(xùn)練成本僅為美國同行的1/23,用H800芯片兩個月跑出比肩GPT-4o的效果,這種效率絞殺直接戳破了硅谷的AI泡沫:中國AI進(jìn)化已突破“算力邊際效益”臨界點,英偉達(dá)芯片不再是必須選項。
尤其是華為騰、摩爾線程等國內(nèi)企業(yè)不斷的更新迭代,國產(chǎn)GPU在整體算力上有了很大提升,已經(jīng)可以替代英偉達(dá)A100、H20了。以華為騰910B為例,騰910B無論是在FP32算力下,還是在FP16算力下,都超過了英偉達(dá)A100,整體訓(xùn)練性能超出英偉達(dá)A100 20%左右。
在這種情況下,美國進(jìn)一步收緊英偉達(dá)芯片出口,甚至調(diào)查新加坡,要把所有的路子堵死。但現(xiàn)在國產(chǎn)廠商已經(jīng)不再需要英偉達(dá)高算力芯片了,DeepSeek以低成本實現(xiàn)了高水平AI模型,只需要少量高端芯片即可,這給了國產(chǎn)算力芯片以極大的發(fā)展空間。
華為的紅利期已經(jīng)來了,華為與DeepSeek的合作,堪稱國產(chǎn)AI領(lǐng)域的“核彈級”爆炸。雙方針對騰芯片的特性,對DeepSeek模型架構(gòu)進(jìn)行了深度優(yōu)化,重構(gòu)了AI模型的計算流程,讓算法與硬件實現(xiàn)了高度適配。
數(shù)據(jù)顯示,2023年,華為算力芯片產(chǎn)量只有10萬片左右,到了2024年出貨量達(dá)到了數(shù)十萬片,F(xiàn)在的登記的需求量已經(jīng)超過百萬片,供需差額太大。與此同時,華為算力芯片的價格由7萬塊錢,增長了12萬,漲幅超過70%。
如果英偉達(dá)不被限制,原本這些收入都是英偉達(dá)的,現(xiàn)在英偉達(dá)只能看著華為賺的盆滿缽滿,只能空著急了。
英偉達(dá)算力霸權(quán)坍塌背后,中國在芯片與人工智能領(lǐng)域正在走一條新路
英偉達(dá)更大的利空還在于,不僅是國內(nèi),未來全球也將大大減少對英偉達(dá)高端芯片的需求,華為騰等國產(chǎn)芯片變得更加具備性價比。尤其是騰910B芯片性能和A100差不多,價格還便宜20%以上,大家自然選它。微軟Azure已悄悄采購了2萬塊騰芯片,亞馬遜AWS開始測試平頭哥的含光800。
加上現(xiàn)在國內(nèi)算力基建正在走入平穩(wěn),頭部企業(yè)服務(wù)器采購量降了40%,對顯卡需求也少了。中小AI企業(yè)轉(zhuǎn)用云計算,自建算力中心熱情沒了,顯卡需求跟著降。英偉達(dá)的苦日子還在后頭。
人工智能,這是美國當(dāng)下維持科技霸權(quán)的核心護(hù)城河之一,他們正在舉全國之力拉伸和幫扶英偉達(dá)!在美國的持續(xù)拉伸和努力下,英偉達(dá)的股票正在拉升,還是有可能再回高峰,但是算力霸權(quán)坍塌的跡象已經(jīng)開始了。
可以說DeepSeek為華為芯片的高端研制創(chuàng)造了時間和空間,從趨勢看,華為這兩年蠶食英偉達(dá)的市場份額的速度會加快,英偉達(dá)在中國市場份額很可能在一年內(nèi)跌破40%。
在芯片領(lǐng)域,DeepSeek 與 LPU 的結(jié)合標(biāo)志著 AI 算力領(lǐng)域的重要變革,而 LPU,作為專為語言處理任務(wù)量身定制的硬件處理器,以其區(qū)別于傳統(tǒng) GPU 的創(chuàng)新架構(gòu)、令人驚嘆的性能表現(xiàn)和超低的成本優(yōu)勢,成為了 AI 領(lǐng)域的新寵。
deepSeek與 LPU結(jié)合打掉英偉達(dá)的算力霸權(quán)可能還只是開胃菜,當(dāng)美國死守硅基芯片時,中國已押注光子芯片和量子計算。2025年初,清華大學(xué)團隊實現(xiàn)光子芯片算力提升1000倍,而合肥量子實驗室的“九章三號”原型機,僅需1毫秒就能完成超級計算機1萬年的運算量。
前段時間,浙江大學(xué)發(fā)布了其研發(fā)團隊攻克了超導(dǎo)量子芯片核心技術(shù)的消息,浙大這個突破直接把我國量子計算研發(fā)進(jìn)度往前推。而上海中微電子此前剛剛發(fā)布了其在28納米蝕刻機獨特技術(shù)專利,加上deepseek在LPU領(lǐng)域的變革,就會發(fā)現(xiàn),在芯片與人工智能領(lǐng)域,中國很可能正在走出另外一條完全不同于歐美的路線。如果是這樣,美國對中國的科技的圍堵就毫無意義了,因為新的技術(shù)路線意味著將建立新的技術(shù)標(biāo)準(zhǔn)與產(chǎn)業(yè)標(biāo)準(zhǔn),在此基礎(chǔ)上建立一個新的產(chǎn)業(yè)鏈,這個時間點或許不遠(yuǎn)了,我們拭目以待。
作者:王新喜 TMT資深評論人 本文未經(jīng)許可謝絕轉(zhuǎn)載