記者 鄒永勤 春節(jié)前后全球最熱門的話題非DeepSeek莫屬。
DeepSeek的全稱為杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,由幻方量化基金的聯(lián)合創(chuàng)始人梁文峰于2023年7月創(chuàng)立,一直專注于大語(yǔ)言模型(LLM)及其相關(guān)技術(shù)的深度研發(fā)。
公開(kāi)信息顯示,DeepSeek于2025年1月20日正式發(fā)布R1模型,并同步開(kāi)源了模型權(quán)重。由于該模型的性能比肩OpenAI o1正式版,所以備受用戶青睞:1月27日,Deepseek應(yīng)用登頂蘋果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜,在美區(qū)下載榜上超越了ChatGPT。
“橫空出世”的DeepSeek迅速成為全球討論的焦點(diǎn),上至硅谷AI巨頭,下至A股小散戶,均熱烈參與了該話題的討論,而中美股市相關(guān)股票亦因此出現(xiàn)劇烈波動(dòng)。
在2024年的全國(guó)兩會(huì)上,全國(guó)政協(xié)委員、360集團(tuán)創(chuàng)始人兼董事長(zhǎng)周鴻便提出了“通用大模型的發(fā)展將是國(guó)運(yùn)之爭(zhēng)”的提案。那么,現(xiàn)在他又如何看待這次的“DeepSeek現(xiàn)象”?2025年2月7日,經(jīng)濟(jì)觀察網(wǎng)就此采訪了周鴻。
DeepSeek崛起的真正意義
經(jīng)濟(jì)觀察網(wǎng):最近,DeepSeek“橫掃”科技圈,成為全球最熱門的話題。你認(rèn)為,DeepSeek的技術(shù)創(chuàng)新與顛覆性究竟體現(xiàn)在哪里呢?
周鴻:今年春節(jié)期間,DeepSeek憑借極低的訓(xùn)練推理成本和超高性能,以及徹底開(kāi)源的R1模型,在短短的一周內(nèi)橫掃全球,迅速登頂模型下載排行榜和應(yīng)用下載排行榜第一名。大量的用戶在試用DeepSeek之后,被其實(shí)際效果驚艷,并紛紛搭建起自己的DeepSeek優(yōu)化模型部署,引發(fā)了市場(chǎng)對(duì)大模型高資本投入模式的質(zhì)疑,以及對(duì)人工智能行業(yè)發(fā)展路徑的思考。
就技術(shù)而言,DeepSeek表現(xiàn)出了兩點(diǎn)優(yōu)勢(shì)。第一,顛覆了推理認(rèn)知的技術(shù)革命,讓AI從鸚鵡學(xué)舌進(jìn)化到自主思考。與傳統(tǒng)大模型填鴨式的死記硬背的監(jiān)督學(xué)習(xí)不一樣,DeepSeek通過(guò)強(qiáng)化學(xué)習(xí)的方式讓AI真正開(kāi)啟了認(rèn)知革命,在推理上獲得了極大進(jìn)步,開(kāi)創(chuàng)了人工智能的新方向。
第二,強(qiáng)化學(xué)習(xí)策略使得人工智能大模型無(wú)效訓(xùn)練降低了60%,對(duì)高強(qiáng)度計(jì)算算力的需求下降了40%。據(jù)了解,DeepSeek-R1的推理成本僅為OpenAI o1成本的3%到5%,實(shí)現(xiàn)了性能與成本的雙重突破,極大地?cái)U(kuò)展了高性能模型的可普及性,降低了使用門檻,使得更多應(yīng)用能快速負(fù)擔(dān)并整合大模型能力,甚至很多C端用戶也可以在電腦和手機(jī)上直接使用高性能的大模型,大幅度擴(kuò)展應(yīng)用場(chǎng)景。
這意味著,中國(guó)正在用更聰明的算法打破大模型發(fā)展路徑上堆積顯卡競(jìng)賽的魔咒,就像當(dāng)年兩彈一星工程用手工計(jì)算出了原子彈的公式一樣,今天我們用數(shù)學(xué)智慧化解了芯片算力的圍剿。
經(jīng)濟(jì)觀察網(wǎng):隨著DeepSeek的火爆出圈,有人將其稱之為“國(guó)運(yùn)級(jí)別”的科技成果。對(duì)此,你怎么看?
周鴻:DeepSeek引起了全球轟動(dòng),使得我們看到了一個(gè)走向AGI(通用人工智能)的新的技術(shù)方向,中國(guó)迎來(lái)了屬于自己的高光時(shí)刻。我覺(jué)得不要僅僅把目光停留在DeepSeek的技術(shù)突破上,它更是給整個(gè)人工智能產(chǎn)業(yè)帶來(lái)了“iPhone時(shí)刻”,并對(duì)AGI發(fā)展帶來(lái)了巨大推動(dòng)。實(shí)際上,這才是中國(guó)在AI領(lǐng)域真正實(shí)現(xiàn)創(chuàng)新和自信的標(biāo)志。
從開(kāi)源到低成本開(kāi)發(fā),從技術(shù)普及到科技平權(quán),再到行業(yè)引領(lǐng),DeepSeek的成功讓全世界看到了中國(guó)人工智能技術(shù)從追趕到比肩的歷史性跨越。它的意義不僅僅在于中國(guó)人工智能公司對(duì)OpenAI等美國(guó)一線大模型公司的一次技術(shù)超越,更證明了中國(guó)用自己的智慧和獨(dú)特的路徑開(kāi)創(chuàng)了影響全球的技術(shù)范式。這也標(biāo)志著大模型真正迎來(lái)了大規(guī)模商用的技術(shù)拐點(diǎn)。
我一直堅(jiān)信,只有把大模型拉下神壇,讓大模型能力從“原子彈”變成“茶葉蛋”,才能真正進(jìn)入百行千業(yè)和千家萬(wàn)戶,進(jìn)而引發(fā)大模型的工業(yè)革命。此次DeepSeek的創(chuàng)新,不僅驗(yàn)證了Transformer(一種基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu),主要用于處理和生成文本數(shù)據(jù))加上強(qiáng)化學(xué)習(xí)路線的有效性,通過(guò)開(kāi)源模式打破了頭部模型的技術(shù)封閉,降低了技術(shù)門檻,同時(shí)也拆解掉了大模型公司所依賴的資本優(yōu)勢(shì),大幅度加速了大模型商業(yè)化的發(fā)展速度,讓更多的企業(yè)和開(kāi)發(fā)者能夠以負(fù)擔(dān)得起的價(jià)格用上頂尖模型。
可以說(shuō),DeepSeek-R1最大的貢獻(xiàn)就是重新教育了企業(yè)用戶和老百姓,讓大家認(rèn)識(shí)到大模型真的可以用了,大模型行業(yè)也從一種探索階段進(jìn)入了創(chuàng)新階段,成為了AI產(chǎn)業(yè)的“iPhone”時(shí)刻。
爭(zhēng)議焦點(diǎn):模型蒸餾與開(kāi)源技術(shù)
經(jīng)濟(jì)觀察網(wǎng):在DeepSeek火爆全球之時(shí),市場(chǎng)上也存在一些不同的聲音。近日有知名研究團(tuán)隊(duì)更是聲稱,通過(guò)蒸餾法以極低成本訓(xùn)練出了可以媲美DeepSeek-R1的模型。請(qǐng)問(wèn),何為蒸餾?你如何看待蒸餾行為?
周鴻:模型蒸餾是人工智能訓(xùn)練中普遍采用的一種方法,就是把大語(yǔ)言模型中的能力和知識(shí)遷移到更小模型的技術(shù),目的在于構(gòu)造資源高效和性能優(yōu)異的小模型。
蒸餾就像是教學(xué),打個(gè)比喻,老師為了快速提高學(xué)生成績(jī),將畢生所學(xué)的題目整理成冊(cè)讓學(xué)生學(xué)習(xí),里面不僅有題目和答案,還有老師的做題思路和備選解題方法。所以學(xué)生在學(xué)習(xí)時(shí)不僅可以學(xué)會(huì)題目和答案,還可以學(xué)會(huì)老師的解題思路,能夠在此基礎(chǔ)上舉一反三,這個(gè)過(guò)程就叫做蒸餾。所以蒸餾并不是偷竊數(shù)據(jù),更像人工智能之間的教學(xué)和互相學(xué)習(xí),美國(guó)做大模型也會(huì)用蒸餾技術(shù)來(lái)加強(qiáng)自己模型的能力。
OpenAI聲稱DeepSeek偷竊了其思維鏈數(shù)據(jù)是一個(gè)謊言。眾所周知,OpenAI o1是一個(gè)強(qiáng)推理模型,作為一個(gè)閉源公司,OpenAI的推理過(guò)程不對(duì)外輸出。這也是為什么DeepSeek要走出一套自己的方法,在不需要任何人工數(shù)據(jù)的情況下,完全靠機(jī)器自己的強(qiáng)化學(xué)習(xí)擁有了強(qiáng)大的思維能力,在人工智能上趟出一條新路。所以在思維鏈能力方面,DeepSeek走的技術(shù)路線和OpenAI完全不一樣,談不上去蒸餾OpenAI的數(shù)據(jù)。
經(jīng)濟(jì)觀察網(wǎng):由于閉源模型的性能往往優(yōu)于開(kāi)源模型,所以O(shè)penAI等巨頭均采用閉源模式,但這次DeepSeek卻通過(guò)開(kāi)源模式給業(yè)界帶來(lái)了巨大的震撼。在你看來(lái),此次DeepSeek的“開(kāi)源革命”,能否引發(fā)AI巨頭對(duì)商業(yè)模式的重新考量?
周鴻:長(zhǎng)期以來(lái),開(kāi)源模型一直在追趕閉源模型,但總是差一點(diǎn)火候。然而這一次DeepSeek作為開(kāi)源模型趕上了所有的閉源模型,一下就將企業(yè)和個(gè)人的需求創(chuàng)造出來(lái)了。所以大模型行業(yè)競(jìng)爭(zhēng)的焦點(diǎn),很快就從如何造模型轉(zhuǎn)向了如何高效用模型,勢(shì)必會(huì)開(kāi)啟一場(chǎng)廣泛的應(yīng)用創(chuàng)新浪潮。
此次DeepSeek-R1不僅開(kāi)放了所有的權(quán)重參數(shù),還公開(kāi)了詳盡的技術(shù)報(bào)告,相當(dāng)于DeepSeek把自己的知識(shí)分享給了整個(gè)人工智能產(chǎn)業(yè)和全人類,不僅開(kāi)源模型使用,而且鼓勵(lì)全球開(kāi)發(fā)者的社區(qū)共同參與貢獻(xiàn)代碼和數(shù)據(jù)。目前在大模型生態(tài)社區(qū),Hugging Face平臺(tái)上已經(jīng)有幾百個(gè)基于DeepSeek派生出來(lái)的衍生模型,這些由世界各地開(kāi)發(fā)的模型正在適應(yīng)各種特定場(chǎng)景的探索需求,這也是開(kāi)源的魅力。
可以說(shuō),DeepSeek徹底踐行了開(kāi)源精神,與OpenAI等走向閉源的公司形成鮮明對(duì)比。OpenAI雖然創(chuàng)立初衷很美好,卻在商業(yè)化浪潮中背離初心,而DeepSeek堅(jiān)守技術(shù)共享,讓全球開(kāi)發(fā)者受益,吸引眾多開(kāi)發(fā)者投身其開(kāi)源生態(tài),有望重塑全球AI產(chǎn)業(yè)格局,使AI發(fā)展重心向開(kāi)源轉(zhuǎn)移,邁向普惠、平等的新階段。
呼吁:拋棄門戶之見(jiàn)、共同支持DeepSeek
經(jīng)濟(jì)觀察網(wǎng):開(kāi)源模型由于其開(kāi)放性和可擴(kuò)展性,似乎面臨著更多的安全威脅,實(shí)際上,近期DeepSeek也頻頻受到網(wǎng)絡(luò)攻擊。在你看來(lái),站在安全的角度來(lái)看,該如何解決開(kāi)源模型的這個(gè)痛點(diǎn)?
周鴻:隨著AI深度融入生活,技術(shù)的穩(wěn)定性和韌性將會(huì)成為關(guān)鍵要素。去年發(fā)生的微軟藍(lán)屏事件證明了如果所有的互聯(lián)網(wǎng)數(shù)據(jù)都必須通過(guò)某一家公司的數(shù)據(jù)中心,一旦這家數(shù)據(jù)中心的服務(wù)中斷必將導(dǎo)致全球停擺。如果AI普及之后,影響還將進(jìn)一步放大,從家庭機(jī)器人到智能網(wǎng)聯(lián)車,當(dāng)AI全面滲透線上線下生活時(shí),人們對(duì)技術(shù)服務(wù)的依賴將急劇加深,任何服務(wù)的中斷都會(huì)變得難以忍受。因此,構(gòu)建深度的技術(shù)安全韌性,將成為避免未來(lái)人類社會(huì)癱瘓的最佳方案。在構(gòu)建AI深度融入社會(huì)的數(shù)字未來(lái)時(shí),開(kāi)源技術(shù)就成了我們實(shí)現(xiàn)安全轉(zhuǎn)型的最重要資產(chǎn)。
開(kāi)源的優(yōu)勢(shì)不僅在于分?jǐn)傆?xùn)練成本,還可以自己調(diào)制可控性、所有權(quán)和隱私保護(hù)。當(dāng)AI深度嵌入社會(huì)時(shí),開(kāi)源的根本價(jià)值將體現(xiàn)在系統(tǒng)韌性上,這也是實(shí)現(xiàn)算力分布式部署本地化運(yùn)行的最有效途徑。當(dāng)每個(gè)人在家里都能部署起自己能跑大模型硬件的時(shí)候,就構(gòu)成了一個(gè)巨大的算力的分布網(wǎng)絡(luò),甚至每個(gè)節(jié)點(diǎn)上都可以跑著一臺(tái)本地化的、不同應(yīng)用方向的大模型。
前不久DeepSeek的線上服務(wù)遭受了IP地址來(lái)自美國(guó)的大規(guī)模DDOS攻擊,這反映了美國(guó)對(duì)DeepSeek崛起的擔(dān)憂,并試圖通過(guò)多種手段限制其發(fā)展。美國(guó)之所以針對(duì)DeepSeek祭出一系列強(qiáng)硬手段,并非僅因?yàn)镈eepSeek技術(shù)領(lǐng)先、導(dǎo)致美股波動(dòng),以及沖擊OpenAI業(yè)務(wù)等因素,更是因?yàn)槠溟_(kāi)源系統(tǒng)能力強(qiáng)大,遠(yuǎn)超OpenAI等在美國(guó)占據(jù)主流的閉源系統(tǒng),此舉或?qū)?dòng)搖美國(guó)的人工智能基礎(chǔ)設(shè)施。一旦美國(guó)的開(kāi)發(fā)人員、技術(shù)人員和公司都開(kāi)始大規(guī)模選擇使用DeepSeek開(kāi)源系統(tǒng),那么整個(gè)AI的發(fā)展重心就會(huì)轉(zhuǎn)移到以DeepSeek為核心的生態(tài)建設(shè)上。
在這個(gè)歷史時(shí)刻,我呼吁國(guó)內(nèi)的同行應(yīng)當(dāng)“拋棄門戶之見(jiàn)”,共同支持DeepSeek。對(duì)此,360也推出了一系列相應(yīng)的支持措施。一方面,我們?cè)笩o(wú)償為DeepSeek提供全方位安全保護(hù)。同時(shí),360推出的納米AI搜索不僅可以使用DeepSeek模型,還專門接入高速專線,集成了DeepSeek蒸餾的快速模型,同時(shí)上線“滿血版DeepSeek模型”,一起為用戶提供最好的AI體驗(yàn)。