經(jīng)濟(jì)觀察網(wǎng) 記者 沈怡然 截至2025年2月6日,DeepSeek(深度求索)的用戶量突破2200萬(wàn)。憑借顛覆性和高性價(jià)比,DeepSeek成為繼ChatGPT之后的又一個(gè)現(xiàn)象級(jí)AI產(chǎn)品,并引發(fā)AI產(chǎn)業(yè)鏈的追逐。
春節(jié)期間,云服務(wù)廠商、GPU廠商和智算中心的建設(shè)方紛紛部署DeepSeek并商討相關(guān)方案。
2月5日以來(lái),國(guó)內(nèi)主要云廠商聯(lián)通云、京東云、阿里云、騰訊云、百度智能云和移動(dòng)云等紛紛上線DeepSeek大模型,并將其納入各自的模型商店。國(guó)際云廠商微軟云和亞馬遜云科技早在春節(jié)前就上線了DeepSeek。
春節(jié)前,移動(dòng)云團(tuán)隊(duì)發(fā)現(xiàn),客戶對(duì)DeepSeek最新版本R1和V3的反應(yīng)非常強(qiáng)烈,便迅速展開(kāi)研究與適配工作,對(duì)DeepSeek的滿血版、蒸餾版、量化版等多個(gè)版本進(jìn)行適配。移動(dòng)云在全國(guó)擁有13個(gè)智算中心,將DeepSeek部署到每一處智算中心并不是個(gè)小工程。
云廠商上線DeepSeek的目的是更好地消耗并兜售自己的算力。DeepSeek的龐大用戶基礎(chǔ),有望為他們帶來(lái)業(yè)務(wù)增量。此外,DeepSeek是開(kāi)源模型,云廠商之間不存在利益沖突。
移動(dòng)云從2024年初起就關(guān)注到DeepSeek,并從V1版本開(kāi)始上架這款模型。然而,從技術(shù)角度看,DeepSeek V1的多模態(tài)能力有限,無(wú)法很好地處理圖像、音頻等非文本信息,且在深度推理場(chǎng)景中也未顯現(xiàn)出強(qiáng)大功能,因此當(dāng)時(shí)用戶的反應(yīng)并不強(qiáng)烈。
直到DeepSeek團(tuán)隊(duì)在2024年12月26日發(fā)布了V3版本,僅使用2048塊英偉達(dá)H800 GPU,訓(xùn)練成本低至558萬(wàn)美元。DeepSeek團(tuán)隊(duì)在2025年1月20日發(fā)布了R1版本,同樣采用了極低成本,實(shí)現(xiàn)了與OpenAI o1系列相當(dāng)?shù)耐评砟芰Α?br/>
云廠商的上游GPU公司也行動(dòng)起來(lái)。GPU是大模型算力的核心器件,目前國(guó)內(nèi)多家GPU公司正在或已完成對(duì)DeepSeek的適配。
國(guó)產(chǎn)GPU公司摩爾線程的工程師在春節(jié)期間加班加點(diǎn),于2月4日完成了DeepSeek蒸餾模型的部署。在該公司看來(lái),這種蒸餾模型就是將大規(guī)模模型的能力遷移至更小、更高效的版本,它借鑒了教育領(lǐng)域中的“知識(shí)傳遞”概念,將一個(gè)大型且復(fù)雜的模型(教師模型)的知識(shí)“傳授”給一個(gè)小型且簡(jiǎn)單的模型(學(xué)生模型)。這種方法不僅減少了模型的計(jì)算和存儲(chǔ)需求,而且使模型更加易于部署。
摩爾線程提供包含GPU和集群在內(nèi)的完整算力基礎(chǔ)設(shè)施,適配DeepSeek能幫助其客戶在資源受限的情況下部署大模型。
快思慢想研究院院長(zhǎng)田豐認(rèn)為,DeepSeek的出現(xiàn)降低了市場(chǎng)對(duì)英偉達(dá)芯片的需求預(yù)期。過(guò)去需要大量英偉達(dá)芯片才能實(shí)現(xiàn)的模型性能,現(xiàn)在可以通過(guò)國(guó)產(chǎn)GPU和DeepSeek以更低的成本實(shí)現(xiàn)。
1月27日以來(lái),英偉達(dá)股價(jià)遭遇最大跌幅17%,市值蒸發(fā)約5400億美元。
不過(guò),各廠商對(duì)DeepSeek的適配尚未得到DeepSeek官方的確認(rèn)。適配的好壞差異較大,這意味著GPU廠商需要在適配方面下功夫,以提升自身產(chǎn)品的性能和競(jìng)爭(zhēng)力。
DeepSeek對(duì)產(chǎn)業(yè)鏈的激活還可能影響國(guó)內(nèi)的智算中心。一位算力中心運(yùn)營(yíng)方人士對(duì)經(jīng)濟(jì)觀察網(wǎng)記者稱(chēng),許多智算中心都在研判DeepSeek,還可能會(huì)因此改變建設(shè)方案,增加國(guó)產(chǎn)設(shè)備的采購(gòu)比例。
據(jù)中國(guó)信息通信研究院數(shù)據(jù),截至2024年7月底,國(guó)內(nèi)納入監(jiān)測(cè)的智算中心(含已建和在建)達(dá)87個(gè)。
前述算力中心運(yùn)營(yíng)方人士稱(chēng),DeepSeek提供的高性價(jià)比模型有助于國(guó)產(chǎn)GPU與國(guó)產(chǎn)云服務(wù)相結(jié)合,形成一整套純國(guó)產(chǎn)方案。過(guò)去,盡管各地政府鼓勵(lì)智算中心增加國(guó)產(chǎn)設(shè)備的采購(gòu),但由于國(guó)產(chǎn)GPU產(chǎn)能和性能不足,未能很好地滿足本土市場(chǎng)需求,導(dǎo)致許多算力中心的采購(gòu)仍以英偉達(dá)品牌為主。