展會(huì)信息港展會(huì)大全

算力即國(guó)力!中美算力戰(zhàn)步步緊逼,中國(guó)AI公司手握“破局密碼”
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2025-02-07 17:05:44   瀏覽:177次  

導(dǎo)讀:智東西2025-02-07 14:15發(fā)布于北京智東西官方賬號(hào)智東西(公眾號(hào):zhidxcom)作者 | 程茜編輯 | 漠影DeepSeek的迅速躥紅,正將大模型領(lǐng)域的激烈競(jìng)爭(zhēng)推向全新高度!一方面,全球大模型廠商打得火熱,DeepSeek登頂中美應(yīng)用市場(chǎng),OpenAI、谷歌紛紛出招反攻;另一方面,算力競(jìng)爭(zhēng)作為AI競(jìng)爭(zhēng)核心戰(zhàn)場(chǎng)的角色被重塑,DeepSeek獲海內(nèi)外各家云巨頭、芯片企業(yè)力挺。隨之而來(lái)的是,DeepSeek ......

智東西

2025-02-07 14:15發(fā)布于北京智東西官方賬號(hào)

智東西(公眾號(hào):zhidxcom)

作者 | 程茜

編輯 | 漠影

DeepSeek的迅速躥紅,正將大模型領(lǐng)域的激烈競(jìng)爭(zhēng)推向全新高度!

一方面,全球大模型廠商打得火熱,DeepSeek登頂中美應(yīng)用市場(chǎng),OpenAI、谷歌紛紛出招反攻;另一方面,算力競(jìng)爭(zhēng)作為AI競(jìng)爭(zhēng)核心戰(zhàn)場(chǎng)的角色被重塑,DeepSeek獲海內(nèi)外各家云巨頭、芯片企業(yè)力挺。

隨之而來(lái)的是,DeepSeek在海外面臨重重考驗(yàn)。美國(guó)、澳大利亞政府宣布全面禁用,意大利、愛(ài)爾蘭、英國(guó)等多國(guó)政府或已開(kāi)展封鎖行動(dòng)或計(jì)劃對(duì)DeepSeek進(jìn)行審查。

這背后的一大隱憂就是,DeepSeek當(dāng)下的成就也是基于以英偉達(dá)為代表的海外算力平臺(tái)達(dá)成,與此同時(shí),海外針對(duì)芯片供應(yīng)的封鎖手段不斷升級(jí),給DeepSeek帶來(lái)的限制日益增多,在這樣的大背景下,實(shí)現(xiàn)國(guó)產(chǎn)算力的自主可控就顯得尤為關(guān)鍵,它不僅關(guān)乎DeepSeek未來(lái)的發(fā)展走向,更對(duì)整個(gè)行業(yè)的穩(wěn)定與安全有著舉足輕重的意義。

要想在這一賽道上搶占先機(jī),算力競(jìng)爭(zhēng)早已成為無(wú)法回避的關(guān)鍵戰(zhàn)場(chǎng),縱觀整個(gè)國(guó)內(nèi)市場(chǎng),已經(jīng)有一家公司在全國(guó)產(chǎn)算力平臺(tái)這條道路上先發(fā)制人。

2023年7月,國(guó)產(chǎn)頭部大模型玩家和國(guó)產(chǎn)算力提供方聯(lián)合拉開(kāi)了全國(guó)產(chǎn)算力平臺(tái)的序幕,這就是訊飛星火大模型與華為騰自主創(chuàng)新算力平臺(tái)的結(jié)合。2023年10月24日,科大訊飛攜手華為正式宣布首個(gè)支撐萬(wàn)億參數(shù)大模型訓(xùn)練的萬(wàn)卡國(guó)產(chǎn)算力平臺(tái)“飛星一號(hào)”啟用。2024年1月30日,首個(gè)在全國(guó)產(chǎn)算力平臺(tái)上訓(xùn)練的訊飛星火V3.5發(fā)布,性能對(duì)標(biāo)國(guó)際最先進(jìn)水平,之后,訊飛星火大模型底座連續(xù)升級(jí),截至目前仍然是國(guó)內(nèi)唯一全棧國(guó)產(chǎn)算力訓(xùn)練、推理雙實(shí)現(xiàn)的大模型。

當(dāng)下,大模型對(duì)于算力的需求,不僅如潮水般持續(xù)涌動(dòng),且呈愈演愈烈之勢(shì),一路高歌猛進(jìn)。與此同時(shí),地緣政治的復(fù)雜博弈下,海外芯片遭遇的封鎖態(tài)勢(shì)愈發(fā)嚴(yán)峻,絲毫沒(méi)有緩和的跡象。在這樣的大環(huán)境下,國(guó)產(chǎn)大模型與國(guó)產(chǎn)算力的深度融合,將成為未來(lái)發(fā)展的必然走向。

DeepSeek的爆火將對(duì)國(guó)內(nèi)模型產(chǎn)業(yè)、算力競(jìng)爭(zhēng)提出哪些新的思考?全國(guó)產(chǎn)算力平臺(tái)在這一階段的重要性如何?它將如何發(fā)力,推動(dòng)國(guó)內(nèi)大模型產(chǎn)業(yè)邁向全新的發(fā)展高度?我們?cè)噲D找到這些問(wèn)題的答案。

一、中國(guó)公司破局,性能和成本制勝美國(guó)同行

眾所周知,算力、算法、數(shù)據(jù)是AI時(shí)代的三大引擎,構(gòu)建強(qiáng)大算力集群、持續(xù)創(chuàng)新算法、廣泛收集和精細(xì)處理數(shù)據(jù)來(lái)推動(dòng)大模型發(fā)展,無(wú)疑是業(yè)界一直以來(lái)的重點(diǎn)。

此次,DeepSeek就是通過(guò)算法創(chuàng)新實(shí)現(xiàn)突圍,其爆火的關(guān)鍵因素可以用兩點(diǎn)概括:性能和成本。

性能層面,DeepSeek R1在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上達(dá)到國(guó)際一流水平。

但反常識(shí)的是,其強(qiáng)大性能背后并沒(méi)有望塵莫及的成本消耗。

根據(jù)DeepSeek的論文,其訓(xùn)練成本為557.6萬(wàn)美元,使用了2048顆H800 GPU,在兩個(gè)月內(nèi)訓(xùn)練了6710億個(gè)參數(shù)的V3大模型,相當(dāng)于280萬(wàn)個(gè)GPU小時(shí)。

從其公布的API定價(jià)推算,DeepSeek每百萬(wàn)tokens輸入價(jià)格0.14美元(緩存命中)、0.55美元(緩存未命中),每百萬(wàn)tokens輸出價(jià)格2.19美元,遠(yuǎn)低于OpenAI o1甚至其最新發(fā)布的OpenAI o3-mini價(jià)格。

在算法優(yōu)化的路徑上,深耕AI領(lǐng)域多年的科大訊飛,也在這兩個(gè)角度有所積累。

科大訊飛的訊飛星火大模型自發(fā)布之初,就錨定了階段性的發(fā)展目標(biāo)。2024年訊飛星火已經(jīng)完成5次持續(xù)升級(jí),持續(xù)對(duì)標(biāo)GPT-4 Turbo和GPT-4o。

算力即國(guó)力!中美算力戰(zhàn)步步緊逼,中國(guó)AI公司手握“破局密碼”

就在今年1月初,其發(fā)布了具備深度思考和推理能力的訊飛星火深度推理模型X1,實(shí)現(xiàn)了更小尺寸、更高性能,多項(xiàng)測(cè)試集指標(biāo)超過(guò)OpenAI o1。

算力即國(guó)力!中美算力戰(zhàn)步步緊逼,中國(guó)AI公司手握“破局密碼”

擅長(zhǎng)深度推理訊飛星火X1可以在給出答案的同時(shí),對(duì)解題思路和步驟進(jìn)行拆解。

算力即國(guó)力!中美算力戰(zhàn)步步緊逼,中國(guó)AI公司手握“破局密碼”

深度推理模型在處理復(fù)雜任務(wù)時(shí),與其他模型相比,在推理能力、特征學(xué)習(xí)、泛化學(xué)習(xí)等方面具有諸多獨(dú)特優(yōu)勢(shì)。

其推理能力支持其更好處理多條件、多步驟的邏輯推理問(wèn)題以及分析復(fù)雜因果關(guān)系等,同時(shí)當(dāng)深入B端企業(yè)的業(yè)務(wù)場(chǎng)景時(shí),還能對(duì)復(fù)雜數(shù)據(jù)進(jìn)行深入分析、推理,為其制定戰(zhàn)略、規(guī)劃業(yè)務(wù)方向、優(yōu)化資源配置等提供更精準(zhǔn)的決策依據(jù)。

同時(shí),深度推理模型還具有強(qiáng)大的泛化能力,可以學(xué)習(xí)到數(shù)據(jù)的一般規(guī)律和模式,遇到新的數(shù)據(jù)或問(wèn)題也能保持相對(duì)穩(wěn)定的性能。

在這些層面,深度推理模型已經(jīng)展現(xiàn)出了提高效率和競(jìng)爭(zhēng)力的優(yōu)勢(shì)。而對(duì)于用戶對(duì)輸出速度有高要求、簡(jiǎn)單直接的任務(wù)場(chǎng)景,通用大模型更為契合用戶需求。

因此,未來(lái)側(cè)重于提供廣泛知識(shí)和基礎(chǔ)能力的通用大模型與專(zhuān)注解決復(fù)雜問(wèn)題、進(jìn)行深度推理的深度推理模型,兩者將互為補(bǔ)充在特定的任務(wù)和領(lǐng)域中發(fā)揮關(guān)鍵作用。

訊飛星火X1還有一大頗受關(guān)注的特征就是,全國(guó)產(chǎn)算力平臺(tái)訓(xùn)練。自主可控的算力平臺(tái),從根本上為大模型成本控制提供了支持。

科大訊飛董事長(zhǎng)劉慶峰坦言,由于訊飛星火X1的部分任務(wù)確實(shí)很難,而且在國(guó)產(chǎn)化算力平臺(tái)上的訓(xùn)練時(shí)間較短、數(shù)據(jù)量較少,還有很大提升空間,未來(lái)一個(gè)月內(nèi)將有新升級(jí)。

DeepSeek用算法創(chuàng)新為國(guó)產(chǎn)GPU打開(kāi)了“黃金窗口”,科大訊飛的全棧自主可控技術(shù)體系已經(jīng)在這種AI新戰(zhàn)局中先人一步。

二、打破壟斷,全國(guó)產(chǎn)算力平臺(tái)沖鋒

一直以來(lái),在AI和高性能計(jì)算等領(lǐng)域,英偉達(dá)的GPU常被視作圭臬,但從芯片到DeepSeek,美國(guó)連番的禁令發(fā)布,使得國(guó)產(chǎn)算力的關(guān)鍵價(jià)值愈發(fā)凸顯,一路水漲船高。

在算法創(chuàng)新一路疾馳、強(qiáng)勢(shì)驅(qū)動(dòng)行業(yè)變革的背后,算力領(lǐng)域既迎來(lái)了前所未有的發(fā)展機(jī)遇,也面臨著諸多嚴(yán)峻的挑戰(zhàn)。

首先是機(jī)遇。

DeepSeek以低成本達(dá)成高性能成果,吸引了諸多頭部平臺(tái)和芯片廠商合作,不僅為自身發(fā)展拓展了市場(chǎng)空間,同時(shí)盡管部分國(guó)產(chǎn)GPU在性能上與英偉達(dá)產(chǎn)品存在差距,但也使得其在優(yōu)化算法、創(chuàng)新應(yīng)用場(chǎng)景等方面看到了更多發(fā)展的可能性。

與此同時(shí),其已經(jīng)走通的低成本、高性能發(fā)展范式,為諸多技術(shù)、資金積累并不充分的AI企業(yè)提供了借鑒和思路,使其能在有限資源下實(shí)現(xiàn)大模型性能突破。更多企業(yè)的入局,對(duì)算力的需求增加,同樣也是國(guó)產(chǎn)算力的一大市場(chǎng)機(jī)遇。

其次是挑戰(zhàn)。

全國(guó)產(chǎn)的算力平臺(tái)上做訓(xùn)練+推理難度極大,但這兩者缺一不可。

大模型對(duì)算力的需求包含訓(xùn)練和推理兩個(gè)方面,受限于國(guó)產(chǎn)芯片的單卡性能、各廠家生態(tài)體系不兼容、大規(guī)模訓(xùn)練時(shí)故障率高、互聯(lián)通信等因素,大模型訓(xùn)練的難度相比于推理更高。

除此以外,大模型訓(xùn)練期間并行算法的優(yōu)化、數(shù)據(jù)傳輸速度、軟件工具鏈的成熟、專(zhuān)業(yè)人才等都會(huì)成為構(gòu)建全國(guó)產(chǎn)算力平臺(tái)的門(mén)檻,這也讓諸多企業(yè)望而卻步,因此部分公司鑒于訓(xùn)練難度高,會(huì)選擇專(zhuān)攻推理。

從 “全國(guó)產(chǎn)” 算力平臺(tái)的維度審視,其前路是未經(jīng)踏足的 “無(wú)人區(qū)”。

當(dāng)構(gòu)建超大規(guī)模的全國(guó)產(chǎn)算力集群時(shí),需要進(jìn)行國(guó)產(chǎn)算力平臺(tái)的適配和效率優(yōu)化,而其中如何實(shí)現(xiàn)高效的集群調(diào)度、穩(wěn)定的通信架構(gòu)以及低延遲的數(shù)據(jù)交互,尚無(wú)成熟的技術(shù)路徑和實(shí)踐經(jīng)驗(yàn)可供參考。

機(jī)遇與挑戰(zhàn)并存的當(dāng)下,首先將“全國(guó)產(chǎn)算力平臺(tái)”變成現(xiàn)實(shí)的就是科大訊飛。

在研發(fā)團(tuán)隊(duì)的長(zhǎng)期攻堅(jiān)下,基于科大訊飛與華為打造的首個(gè)支撐萬(wàn)億參數(shù)大模型訓(xùn)練的萬(wàn)卡國(guó)產(chǎn)算力平臺(tái)“飛星一號(hào)”訓(xùn)練,星火大模型實(shí)現(xiàn)全棧國(guó)產(chǎn)適配優(yōu)化。

劉慶峰曾透露,在騰910B的基礎(chǔ)上,科大訊飛攻克了諸多疑難雜癥,解決了數(shù)百次基礎(chǔ)軟硬件問(wèn)題、模型適配問(wèn)題等,使得大模型訓(xùn)練從對(duì)標(biāo)A100/A800的20%~30%提升到90%以上。國(guó)產(chǎn)算力的提升,使得國(guó)內(nèi)企業(yè)在進(jìn)行大模型訓(xùn)練時(shí),對(duì)國(guó)外算力租賃的依賴(lài)降低,這對(duì)于降低大模型成本的影響深遠(yuǎn)。

繼“飛星一號(hào)”之后,2024年10月,科大訊飛、華為、合肥市大數(shù)據(jù)資產(chǎn)運(yùn)營(yíng)有限公司三方聯(lián)合打造的國(guó)產(chǎn)超大規(guī)模智算平臺(tái)“飛星二號(hào)”正式啟動(dòng),并將于今年交付首批算力。

訊飛星火大模型正是全國(guó)產(chǎn)算力平臺(tái)最直接的驗(yàn)證,也是科大訊飛在全國(guó)產(chǎn)算力平臺(tái)這條道路上前行的一個(gè)關(guān)鍵里程碑。

自主可控、全國(guó)產(chǎn)算力已經(jīng)深深刻進(jìn)了科大訊飛的發(fā)展基因中,現(xiàn)狀也證明,科大訊飛走“全國(guó)產(chǎn)算力平臺(tái)”的必要性與正確性。

三、生態(tài)協(xié)同、行業(yè)應(yīng)用,國(guó)內(nèi)大模型產(chǎn)業(yè)鏈已起飛

DeepSeek在成為業(yè)界熱議焦點(diǎn)的同時(shí),開(kāi)啟了國(guó)內(nèi)大模型產(chǎn)業(yè)對(duì)生態(tài)協(xié)同與行業(yè)應(yīng)用的深度思考。

國(guó)內(nèi)大模型上下游產(chǎn)業(yè)鏈玩家紛紛宣布合作。不僅有摩爾線程、燧原科技等國(guó)產(chǎn)GPU企業(yè),還有華為云、阿里云等國(guó)內(nèi)云計(jì)算巨頭,無(wú)問(wèn)芯穹、硅基流動(dòng)等AI基礎(chǔ)設(shè)施企業(yè),均已宣布適配及上架DeepSeek模型服務(wù)。

DeepSeek狂飆在前,也給大模型產(chǎn)業(yè)發(fā)出警醒,數(shù)據(jù)安全、行業(yè)應(yīng)用、生態(tài)健康正借勢(shì)發(fā)展。

算法創(chuàng)新、算力發(fā)展背后,數(shù)據(jù)同樣是模型能力發(fā)展的重中之重,讓大模型深入企業(yè)內(nèi)部、重要行業(yè)的關(guān)鍵之一就是,能保證其核心數(shù)據(jù)的安全,并使得這些數(shù)據(jù)被有效利用起來(lái)。

在AI領(lǐng)域20余年的深耕,也為科大訊飛提供了數(shù)據(jù)優(yōu)勢(shì)?拼笥嶏w正利用自主可控的技術(shù)能力和行業(yè)合作優(yōu)勢(shì),構(gòu)建高質(zhì)量數(shù)據(jù)飛輪。

在場(chǎng)景應(yīng)用層面,大模型發(fā)展的核心命題就是深入場(chǎng)景,實(shí)現(xiàn)降本增效。在這一關(guān)鍵節(jié)點(diǎn),如何讓DeepSeek帶動(dòng)的產(chǎn)業(yè)紅利深入不同行業(yè),真正在關(guān)鍵場(chǎng)景發(fā)揮作用,勢(shì)必需要結(jié)合此前產(chǎn)業(yè)玩家的經(jīng)驗(yàn)積累,找到最快落地的場(chǎng)景。

產(chǎn)業(yè)協(xié)同同樣關(guān)鍵,產(chǎn)業(yè)鏈玩家協(xié)同發(fā)力不斷優(yōu)化算法、挖掘模型潛力的同時(shí),立足行業(yè)痛點(diǎn)開(kāi)展應(yīng)用創(chuàng)新,借此使得大模型產(chǎn)業(yè)健康、正向發(fā)展。

從DeepSeek看國(guó)產(chǎn)算力、數(shù)據(jù)安全、場(chǎng)景應(yīng)用、行業(yè)創(chuàng)新,我們發(fā)現(xiàn),科大訊飛的業(yè)務(wù)布局顯示,其已經(jīng)先發(fā)制人。

第一天做大模型,科大訊飛就確定了“1+N路徑”。結(jié)合通用底座、工具鏈和知識(shí)工程,訊星火擁有從頂層規(guī)劃到執(zhí)行落地的全套解決方案,包含“建算力、理數(shù)據(jù)、訓(xùn)模型、落場(chǎng)景、保安全、精運(yùn)營(yíng)”。

算力即國(guó)力!中美算力戰(zhàn)步步緊逼,中國(guó)AI公司手握“破局密碼”

發(fā)展至今,在大模型招投標(biāo)市場(chǎng),科大訊飛央國(guó)企中標(biāo)數(shù)量和中標(biāo)金額雙第一,還獲得教育、醫(yī)療、金融等多個(gè)領(lǐng)域應(yīng)用第一,其中在教育領(lǐng)域,其服務(wù)1.3億師生、5萬(wàn)余所學(xué)校,深度參與12個(gè)國(guó)家智慧教育示范區(qū)建設(shè);醫(yī)療領(lǐng)域智醫(yī)助理覆蓋677個(gè)區(qū)縣服務(wù)全國(guó)600家等級(jí)醫(yī)院,與7家排名前十醫(yī)院深度合作;金融領(lǐng)域交行、人保等頭部金融客戶占位中標(biāo)27個(gè)。

這些深度合作的行業(yè)案例已經(jīng)成為科大訊飛發(fā)展大模型的關(guān)鍵積累,并反哺行業(yè),以技術(shù)迭代、效率提升等形式,為行業(yè)發(fā)展注入源源不斷的動(dòng)力,實(shí)現(xiàn)互利共贏的良性循環(huán)。

國(guó)內(nèi)全產(chǎn)業(yè)鏈的協(xié)作使得中國(guó)大模型產(chǎn)業(yè)的發(fā)展邁入新的階段,科大訊飛的布局也已經(jīng)為產(chǎn)業(yè)鏈發(fā)展打了個(gè)樣。

科大訊飛的生態(tài)布局可以用一句話概括:加強(qiáng)C端用戶體驗(yàn)、深耕B端行業(yè)應(yīng)用以及選擇G端合作的戰(zhàn)略布局。

劉慶峰提到,科大訊飛要做的事是加強(qiáng)C端、做深B端,選擇G端。學(xué)習(xí)機(jī)是科大訊飛必做的大模型時(shí)代的跨越鴻溝的C端產(chǎn)品;B端持續(xù)深化合作汽車(chē)、金融和運(yùn)營(yíng)商;G端選準(zhǔn)城市,搶抓機(jī)遇。

科大訊飛已經(jīng)在全國(guó)產(chǎn)平臺(tái)的基礎(chǔ)上長(zhǎng)出參天大樹(shù),并從芯片適配到框架優(yōu)化,形成一套可復(fù)用的“國(guó)產(chǎn)算力大模型方法論”,推動(dòng)國(guó)產(chǎn)技術(shù)的崛起。

結(jié)語(yǔ):DeepSeek掀起浪潮,訊飛用國(guó)產(chǎn)算力借勢(shì)突圍

DeepSeek爆火改變了大模型產(chǎn)業(yè)的發(fā)展格局,就連OpenAI CEO薩姆阿爾特曼(Sam Altman)也坦言O(shè)penAI的領(lǐng)先優(yōu)勢(shì)正在縮小。

在這波變革浪潮中,算法創(chuàng)新持續(xù)迭代,也讓全國(guó)產(chǎn)算力平臺(tái)的重要性愈發(fā)凸顯。科大訊飛的前瞻性布局在此刻被推向新的巔峰。

已經(jīng)在全國(guó)產(chǎn)算力平臺(tái)、模型場(chǎng)景應(yīng)用、生態(tài)協(xié)作布局上闖出一條路徑的科大訊飛,已經(jīng)將大廈建在國(guó)產(chǎn)的地基上,助推中國(guó)AI產(chǎn)業(yè)在全球競(jìng)爭(zhēng)中邁出關(guān)鍵一步。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港