當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人物報(bào)道 > 周鴻祎談DeepSeek：開(kāi)啟AI產(chǎn)業(yè)的“iPhone”時(shí)刻

周鴻祎談DeepSeek：開(kāi)啟AI產(chǎn)業(yè)的“iPhone”時(shí)刻
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-09 10:14:45 瀏覽：126次

導(dǎo)讀：記者鄒永勤春節(jié)前后全球最熱門的話題非DeepSeek莫屬。DeepSeek的全稱為杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司，由幻方量化基金的聯(lián)合創(chuàng)始人梁文峰于2023年7月創(chuàng)立，一直專注于大語(yǔ)言模型（LLM）及其相關(guān)技術(shù)的深度研發(fā)。公開(kāi)信息顯示，DeepSeek于2025年1月20日正式發(fā)布R1模型，并同步開(kāi)源了模型權(quán)重。由于該模型的性能比肩OpenAI o1正式版，所以備受用戶青睞：1月27日，D ......

周鴻祎談DeepSeek：開(kāi)啟AI產(chǎn)業(yè)的“iPhone”時(shí)刻

記者鄒永勤 春節(jié)前后全球最熱門的話題非DeepSeek莫屬。

DeepSeek的全稱為杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司，由幻方量化基金的聯(lián)合創(chuàng)始人梁文峰于2023年7月創(chuàng)立，一直專注于大語(yǔ)言模型（LLM）及其相關(guān)技術(shù)的深度研發(fā)。

公開(kāi)信息顯示，DeepSeek于2025年1月20日正式發(fā)布R1模型，并同步開(kāi)源了模型權(quán)重。由于該模型的性能比肩OpenAI o1正式版，所以備受用戶青睞：1月27日，Deepseek應(yīng)用登頂蘋果中國(guó)地區(qū)和美國(guó)地區(qū)應(yīng)用商店免費(fèi)APP下載排行榜，在美區(qū)下載榜上超越了ChatGPT。

“橫空出世”的DeepSeek迅速成為全球討論的焦點(diǎn)，上至硅谷AI巨頭，下至A股小散戶，均熱烈參與了該話題的討論，而中美股市相關(guān)股票亦因此出現(xiàn)劇烈波動(dòng)。

在2024年的全國(guó)兩會(huì)上，全國(guó)政協(xié)委員、360集團(tuán)創(chuàng)始人兼董事長(zhǎng)周鴻便提出了“通用大模型的發(fā)展將是國(guó)運(yùn)之爭(zhēng)”的提案。那么，現(xiàn)在他又如何看待這次的“DeepSeek現(xiàn)象”？2025年2月7日，經(jīng)濟(jì)觀察網(wǎng)就此采訪了周鴻。

DeepSeek崛起的真正意義

經(jīng)濟(jì)觀察網(wǎng)：最近，DeepSeek“橫掃”科技圈，成為全球最熱門的話題。你認(rèn)為，DeepSeek的技術(shù)創(chuàng)新與顛覆性究竟體現(xiàn)在哪里呢？

周鴻：今年春節(jié)期間，DeepSeek憑借極低的訓(xùn)練推理成本和超高性能，以及徹底開(kāi)源的R1模型，在短短的一周內(nèi)橫掃全球，迅速登頂模型下載排行榜和應(yīng)用下載排行榜第一名。大量的用戶在試用DeepSeek之后，被其實(shí)際效果驚艷，并紛紛搭建起自己的DeepSeek優(yōu)化模型部署，引發(fā)了市場(chǎng)對(duì)大模型高資本投入模式的質(zhì)疑，以及對(duì)人工智能行業(yè)發(fā)展路徑的思考。

就技術(shù)而言，DeepSeek表現(xiàn)出了兩點(diǎn)優(yōu)勢(shì)。第一，顛覆了推理認(rèn)知的技術(shù)革命，讓AI從鸚鵡學(xué)舌進(jìn)化到自主思考。與傳統(tǒng)大模型填鴨式的死記硬背的監(jiān)督學(xué)習(xí)不一樣，DeepSeek通過(guò)強(qiáng)化學(xué)習(xí)的方式讓AI真正開(kāi)啟了認(rèn)知革命，在推理上獲得了極大進(jìn)步，開(kāi)創(chuàng)了人工智能的新方向。

第二，強(qiáng)化學(xué)習(xí)策略使得人工智能大模型無(wú)效訓(xùn)練降低了60%，對(duì)高強(qiáng)度計(jì)算算力的需求下降了40%。據(jù)了解，DeepSeek-R1的推理成本僅為OpenAI o1成本的3%到5%，實(shí)現(xiàn)了性能與成本的雙重突破，極大地?cái)U(kuò)展了高性能模型的可普及性，降低了使用門檻，使得更多應(yīng)用能快速負(fù)擔(dān)并整合大模型能力，甚至很多C端用戶也可以在電腦和手機(jī)上直接使用高性能的大模型，大幅度擴(kuò)展應(yīng)用場(chǎng)景。

這意味著，中國(guó)正在用更聰明的算法打破大模型發(fā)展路徑上堆積顯卡競(jìng)賽的魔咒，就像當(dāng)年兩彈一星工程用手工計(jì)算出了原子彈的公式一樣，今天我們用數(shù)學(xué)智慧化解了芯片算力的圍剿。

經(jīng)濟(jì)觀察網(wǎng)：隨著DeepSeek的火爆出圈，有人將其稱之為“國(guó)運(yùn)級(jí)別”的科技成果。對(duì)此，你怎么看？

周鴻：DeepSeek引起了全球轟動(dòng)，使得我們看到了一個(gè)走向AGI（通用人工智能）的新的技術(shù)方向，中國(guó)迎來(lái)了屬于自己的高光時(shí)刻。我覺(jué)得不要僅僅把目光停留在DeepSeek的技術(shù)突破上，它更是給整個(gè)人工智能產(chǎn)業(yè)帶來(lái)了“iPhone時(shí)刻”，并對(duì)AGI發(fā)展帶來(lái)了巨大推動(dòng)。實(shí)際上，這才是中國(guó)在AI領(lǐng)域真正實(shí)現(xiàn)創(chuàng)新和自信的標(biāo)志。

從開(kāi)源到低成本開(kāi)發(fā)，從技術(shù)普及到科技平權(quán)，再到行業(yè)引領(lǐng)，DeepSeek的成功讓全世界看到了中國(guó)人工智能技術(shù)從追趕到比肩的歷史性跨越。它的意義不僅僅在于中國(guó)人工智能公司對(duì)OpenAI等美國(guó)一線大模型公司的一次技術(shù)超越，更證明了中國(guó)用自己的智慧和獨(dú)特的路徑開(kāi)創(chuàng)了影響全球的技術(shù)范式。這也標(biāo)志著大模型真正迎來(lái)了大規(guī)模商用的技術(shù)拐點(diǎn)。

我一直堅(jiān)信，只有把大模型拉下神壇，讓大模型能力從“原子彈”變成“茶葉蛋”，才能真正進(jìn)入百行千業(yè)和千家萬(wàn)戶，進(jìn)而引發(fā)大模型的工業(yè)革命。此次DeepSeek的創(chuàng)新，不僅驗(yàn)證了Transformer（一種基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)架構(gòu)，主要用于處理和生成文本數(shù)據(jù)）加上強(qiáng)化學(xué)習(xí)路線的有效性，通過(guò)開(kāi)源模式打破了頭部模型的技術(shù)封閉，降低了技術(shù)門檻，同時(shí)也拆解掉了大模型公司所依賴的資本優(yōu)勢(shì)，大幅度加速了大模型商業(yè)化的發(fā)展速度，讓更多的企業(yè)和開(kāi)發(fā)者能夠以負(fù)擔(dān)得起的價(jià)格用上頂尖模型。

可以說(shuō)，DeepSeek-R1最大的貢獻(xiàn)就是重新教育了企業(yè)用戶和老百姓，讓大家認(rèn)識(shí)到大模型真的可以用了，大模型行業(yè)也從一種探索階段進(jìn)入了創(chuàng)新階段，成為了AI產(chǎn)業(yè)的“iPhone”時(shí)刻。

爭(zhēng)議焦點(diǎn)：模型蒸餾與開(kāi)源技術(shù)

經(jīng)濟(jì)觀察網(wǎng)：在DeepSeek火爆全球之時(shí)，市場(chǎng)上也存在一些不同的聲音。近日有知名研究團(tuán)隊(duì)更是聲稱，通過(guò)蒸餾法以極低成本訓(xùn)練出了可以媲美DeepSeek-R1的模型。請(qǐng)問(wèn)，何為蒸餾？你如何看待蒸餾行為？

周鴻：模型蒸餾是人工智能訓(xùn)練中普遍采用的一種方法，就是把大語(yǔ)言模型中的能力和知識(shí)遷移到更小模型的技術(shù)，目的在于構(gòu)造資源高效和性能優(yōu)異的小模型。

蒸餾就像是教學(xué)，打個(gè)比喻，老師為了快速提高學(xué)生成績(jī)，將畢生所學(xué)的題目整理成冊(cè)讓學(xué)生學(xué)習(xí)，里面不僅有題目和答案，還有老師的做題思路和備選解題方法。所以學(xué)生在學(xué)習(xí)時(shí)不僅可以學(xué)會(huì)題目和答案，還可以學(xué)會(huì)老師的解題思路，能夠在此基礎(chǔ)上舉一反三，這個(gè)過(guò)程就叫做蒸餾。所以蒸餾并不是偷竊數(shù)據(jù)，更像人工智能之間的教學(xué)和互相學(xué)習(xí)，美國(guó)做大模型也會(huì)用蒸餾技術(shù)來(lái)加強(qiáng)自己模型的能力。

OpenAI聲稱DeepSeek偷竊了其思維鏈數(shù)據(jù)是一個(gè)謊言。眾所周知，OpenAI o1是一個(gè)強(qiáng)推理模型，作為一個(gè)閉源公司，OpenAI的推理過(guò)程不對(duì)外輸出。這也是為什么DeepSeek要走出一套自己的方法，在不需要任何人工數(shù)據(jù)的情況下，完全靠機(jī)器自己的強(qiáng)化學(xué)習(xí)擁有了強(qiáng)大的思維能力，在人工智能上趟出一條新路。所以在思維鏈能力方面，DeepSeek走的技術(shù)路線和OpenAI完全不一樣，談不上去蒸餾OpenAI的數(shù)據(jù)。

經(jīng)濟(jì)觀察網(wǎng)：由于閉源模型的性能往往優(yōu)于開(kāi)源模型，所以O(shè)penAI等巨頭均采用閉源模式，但這次DeepSeek卻通過(guò)開(kāi)源模式給業(yè)界帶來(lái)了巨大的震撼。在你看來(lái)，此次DeepSeek的“開(kāi)源革命”，能否引發(fā)AI巨頭對(duì)商業(yè)模式的重新考量？

周鴻：長(zhǎng)期以來(lái)，開(kāi)源模型一直在追趕閉源模型，但總是差一點(diǎn)火候。然而這一次DeepSeek作為開(kāi)源模型趕上了所有的閉源模型，一下就將企業(yè)和個(gè)人的需求創(chuàng)造出來(lái)了。所以大模型行業(yè)競(jìng)爭(zhēng)的焦點(diǎn)，很快就從如何造模型轉(zhuǎn)向了如何高效用模型，勢(shì)必會(huì)開(kāi)啟一場(chǎng)廣泛的應(yīng)用創(chuàng)新浪潮。

此次DeepSeek-R1不僅開(kāi)放了所有的權(quán)重參數(shù)，還公開(kāi)了詳盡的技術(shù)報(bào)告，相當(dāng)于DeepSeek把自己的知識(shí)分享給了整個(gè)人工智能產(chǎn)業(yè)和全人類，不僅開(kāi)源模型使用，而且鼓勵(lì)全球開(kāi)發(fā)者的社區(qū)共同參與貢獻(xiàn)代碼和數(shù)據(jù)。目前在大模型生態(tài)社區(qū)，Hugging Face平臺(tái)上已經(jīng)有幾百個(gè)基于DeepSeek派生出來(lái)的衍生模型，這些由世界各地開(kāi)發(fā)的模型正在適應(yīng)各種特定場(chǎng)景的探索需求，這也是開(kāi)源的魅力。

可以說(shuō)，DeepSeek徹底踐行了開(kāi)源精神，與OpenAI等走向閉源的公司形成鮮明對(duì)比。OpenAI雖然創(chuàng)立初衷很美好，卻在商業(yè)化浪潮中背離初心，而DeepSeek堅(jiān)守技術(shù)共享，讓全球開(kāi)發(fā)者受益，吸引眾多開(kāi)發(fā)者投身其開(kāi)源生態(tài)，有望重塑全球AI產(chǎn)業(yè)格局，使AI發(fā)展重心向開(kāi)源轉(zhuǎn)移，邁向普惠、平等的新階段。

呼吁：拋棄門戶之見(jiàn)、共同支持DeepSeek

經(jīng)濟(jì)觀察網(wǎng)：開(kāi)源模型由于其開(kāi)放性和可擴(kuò)展性，似乎面臨著更多的安全威脅，實(shí)際上，近期DeepSeek也頻頻受到網(wǎng)絡(luò)攻擊。在你看來(lái)，站在安全的角度來(lái)看，該如何解決開(kāi)源模型的這個(gè)痛點(diǎn)？

周鴻：隨著AI深度融入生活，技術(shù)的穩(wěn)定性和韌性將會(huì)成為關(guān)鍵要素。去年發(fā)生的微軟藍(lán)屏事件證明了如果所有的互聯(lián)網(wǎng)數(shù)據(jù)都必須通過(guò)某一家公司的數(shù)據(jù)中心，一旦這家數(shù)據(jù)中心的服務(wù)中斷必將導(dǎo)致全球停擺。如果AI普及之后，影響還將進(jìn)一步放大，從家庭機(jī)器人到智能網(wǎng)聯(lián)車，當(dāng)AI全面滲透線上線下生活時(shí)，人們對(duì)技術(shù)服務(wù)的依賴將急劇加深，任何服務(wù)的中斷都會(huì)變得難以忍受。因此，構(gòu)建深度的技術(shù)安全韌性，將成為避免未來(lái)人類社會(huì)癱瘓的最佳方案。在構(gòu)建AI深度融入社會(huì)的數(shù)字未來(lái)時(shí)，開(kāi)源技術(shù)就成了我們實(shí)現(xiàn)安全轉(zhuǎn)型的最重要資產(chǎn)。

開(kāi)源的優(yōu)勢(shì)不僅在于分?jǐn)傆?xùn)練成本，還可以自己調(diào)制可控性、所有權(quán)和隱私保護(hù)。當(dāng)AI深度嵌入社會(huì)時(shí)，開(kāi)源的根本價(jià)值將體現(xiàn)在系統(tǒng)韌性上，這也是實(shí)現(xiàn)算力分布式部署本地化運(yùn)行的最有效途徑。當(dāng)每個(gè)人在家里都能部署起自己能跑大模型硬件的時(shí)候，就構(gòu)成了一個(gè)巨大的算力的分布網(wǎng)絡(luò)，甚至每個(gè)節(jié)點(diǎn)上都可以跑著一臺(tái)本地化的、不同應(yīng)用方向的大模型。

前不久DeepSeek的線上服務(wù)遭受了IP地址來(lái)自美國(guó)的大規(guī)模DDOS攻擊，這反映了美國(guó)對(duì)DeepSeek崛起的擔(dān)憂，并試圖通過(guò)多種手段限制其發(fā)展。美國(guó)之所以針對(duì)DeepSeek祭出一系列強(qiáng)硬手段，并非僅因?yàn)镈eepSeek技術(shù)領(lǐng)先、導(dǎo)致美股波動(dòng)，以及沖擊OpenAI業(yè)務(wù)等因素，更是因?yàn)槠溟_(kāi)源系統(tǒng)能力強(qiáng)大，遠(yuǎn)超OpenAI等在美國(guó)占據(jù)主流的閉源系統(tǒng)，此舉或?qū)?dòng)搖美國(guó)的人工智能基礎(chǔ)設(shè)施。一旦美國(guó)的開(kāi)發(fā)人員、技術(shù)人員和公司都開(kāi)始大規(guī)模選擇使用DeepSeek開(kāi)源系統(tǒng)，那么整個(gè)AI的發(fā)展重心就會(huì)轉(zhuǎn)移到以DeepSeek為核心的生態(tài)建設(shè)上。

在這個(gè)歷史時(shí)刻，我呼吁國(guó)內(nèi)的同行應(yīng)當(dāng)“拋棄門戶之見(jiàn)”，共同支持DeepSeek。對(duì)此，360也推出了一系列相應(yīng)的支持措施。一方面，我們?cè)笩o(wú)償為DeepSeek提供全方位安全保護(hù)。同時(shí)，360推出的納米AI搜索不僅可以使用DeepSeek模型，還專門接入高速專線，集成了DeepSeek蒸餾的快速模型，同時(shí)上線“滿血版DeepSeek模型”，一起為用戶提供最好的AI體驗(yàn)。

相關(guān)熱詞： 周鴻 deepseek ai產(chǎn)業(yè) openai iphone

上一篇：GenAI賦予金融機(jī)構(gòu)創(chuàng)新動(dòng)能

下一篇：Meta被曝AI訓(xùn)練黑幕！下載81.7TB盜版數(shù)據(jù)喂養(yǎng)模型，CEO竟稱不知情？

周鴻祎談DeepSeek：開(kāi)啟AI產(chǎn)業(yè)的“iPhone”時(shí)刻
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-09 10:14:45 瀏覽：126次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

周鴻祎談DeepSeek：開(kāi)啟AI產(chǎn)業(yè)的“iPhone”時(shí)刻 來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-09 10:14:45 瀏覽：126次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

周鴻祎談DeepSeek：開(kāi)啟AI產(chǎn)業(yè)的“iPhone”時(shí)刻
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-02-09 10:14:45 瀏覽：126次