展會信息港展會大全

英偉達跌倒,AI芯片創(chuàng)企卻吃飽?DeepSeek開啟推理大時代
來源:互聯網   發(fā)布日期:2025-02-09 10:15:22   瀏覽:178次  

導讀:《科創(chuàng)板日報》2月8日訊 DeepSeek R1模型的橫空出世,在全球范圍內一度引發(fā)了對算力長期需求的質疑,甚至重挫英偉達股價。算力需求真的將要萎縮嗎?AI芯片初創(chuàng)公司可能不會這么認為。在他們眼中,這不是一個威脅,而是一個能“做大做強”的巨大機會隨著越來越多的客戶采用和搭建起DeepSeek開源模型,對推理芯片和算力的需求正在攀升。英偉達競爭對手之一Cerebras Systems主要為 ......

《科創(chuàng)板日報》2月8日訊 DeepSeek R1模型的橫空出世,在全球范圍內一度引發(fā)了對算力長期需求的質疑,甚至重挫英偉達股價。

算力需求真的將要萎縮嗎?

AI芯片初創(chuàng)公司可能不會這么認為。在他們眼中,這不是一個威脅,而是一個能“做大做強”的巨大機會隨著越來越多的客戶采用和搭建起DeepSeek開源模型,對推理芯片和算力的需求正在攀升。

英偉達競爭對手之一Cerebras Systems主要為客戶提供AI芯片,并可以通過自家計算集群為客戶提供云服務,去年8月曾發(fā)布號稱是“全球最快的AI推理解決方案”的Cerebras Inference。

這家公司CEO Andrew Feldman向CNBC透露,DeepSeek R1模型發(fā)布之后,公司迎來了“有史以來最大的服務需求高峰之一”。“開發(fā)者非常想用DeepSeek R1這樣的開源模型取代OpenAI昂貴且封閉的模型。價格下降能推動全球使用范圍擴張,就像之前的PC和互聯網行業(yè),而現在AI也正走在一條類似的長期增長之路上。”

另一家AI芯片制造商Etched也表示,自從DeepSeek發(fā)布推理模型以來,已有數十家公司向Etched伸出了橄欖枝,因此公司正在將支出從訓練集群轉向推理集群。“DeepSeek-R1證明了推理計算已成為每個主要模型供應商的‘最先進’方法,而推理思考并不便宜為了將這些模型擴展到數百萬用戶,我們將需要越來越多的算力!

“從DeepSeek的例子就能看到,較小的開放模型可以訓練得與更大的專有模型一樣強大,甚至更強,而且這可以以極低的成本實現。而小型模型的普及,將進一步催化推理時代到來。”AI芯片初創(chuàng)公司 d-Matrix首席執(zhí)行官Sid Sheth也表示。

在芯片初創(chuàng)公司和業(yè)內分析師們看來,DeepSeek有望加速“從訓練到推理”的AI周期,促進新芯片技術采用。

“簡單來說,AI訓練是構建一個工具或算法,而推理則是將這個工具實際應用于現實場景中!盡orningstar半導體分析師Phelix Lee稱,AI訓練非常依賴算力,但推理可以在不那么先進的芯片上進行,這些芯片可以執(zhí)行較窄范圍的任務。

“AI行業(yè)的杰文斯悖論”

實際上,DeepSeek日前的表現也反應了算力還是不夠用。

2月6日DeepSeek突然暫停其API服務充值,按鈕顯示灰色不可用狀態(tài)。對此官方聲明稱,“當前服務器資源緊張,為避免對您造成業(yè)務影響,我們已暫停 API 服務充值。存量充值金額可繼續(xù)調用,敬請諒解!”

據國泰君安測算,假設DeepSeek日均訪問量為1億次每次提問10次,每次提問的回復用到1000個token,1000個token大概對應750個英文字母,則DeepSeek每秒的推理算力需求為1.6*1019TOPs。在這種普通推理情境下, 假設DeepSeek采用的是FP8精度的H100卡做推理,利用率50%,那么推理端H100卡需求為16177張,A100卡需求為51282張。

英偉達跌倒,AI芯片創(chuàng)企卻吃飽?DeepSeek開啟推理大時代

其進一步表示,在以DeepSeek為首的低成本推理模型的逐漸普及下,推理成本及價格大幅削減勢必會帶來應用側繁榮,由此將拉動成倍數的總算力需求提升

未來的AI投入不再盲目“大力出奇跡”的Scaling Law,逐漸將重心從預訓練轉向推理,東吳證券認為,訓練+推理的整體需求依然樂觀,參考從2G到4G流量費用不斷降低,但因為用量的指數級提升,導致整體市場規(guī)模依然快速增大。

回看19世紀,英國經濟學家杰文斯發(fā)現,當通過技術提升,實現煤炭使用效率提高、成本下探,煤炭消費量反而會增加,從而提出了環(huán)境經濟學中廣為人知的“杰文斯悖論”。

站在160年后的今天,當DeepSeek通過技術降本,為AI應用打開更多落地場景,“杰文斯悖論”或許也將在AI行業(yè)應驗。

(科創(chuàng)板日報 鄭遠方)

贊助本站

相關內容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港