【文/觀察者網(wǎng)專欄作者 晨楓】
DeepSeek突然成為炙手可熱的全球性話題,不僅因為其以低成本實現(xiàn)了“以小搏大”,其成功故事也成為國運的寫照。
簡單來說,人工智能可能像幾十年前開始的芯片控制和數(shù)字化一樣,將深植于幾乎所有新科技的創(chuàng)建和老科技的升級之中。但低成本帶來質(zhì)變,不只是量變。
汽車是德國的卡爾奔馳發(fā)明的,但在美國的亨利福特發(fā)明流水線、海量生產(chǎn)低成本的T型汽車之前,汽車只是有錢人的玩物、豪華馬車的代用品。在福特之后,低成本汽車迅速改變了人們的生活方式,也在本質(zhì)上重塑了世界經(jīng)濟(jì),成為世界經(jīng)濟(jì)和政治中心從歐洲轉(zhuǎn)移到美國的重要推手。
低成本人工智能有望起到類似的作用,DeepSeek的開源路線和“蒸餾技術(shù)”使得“白菜化人工智能”成為可能。
DeepSeek V3 不僅在性能上表現(xiàn)出色,其性價比也遙遙領(lǐng)先同類大模型
再通用的大模型也會是“萬寶全書缺只角”,開源路線使得其他人可以在開源構(gòu)架上打造自己的人工智能應(yīng)用,“蒸餾技術(shù)”則可以用小模型去蕪存菁地保留需要保留的方面,有針對性地加強(qiáng)大模型不足之處,進(jìn)一步縮小模型,降低訓(xùn)練和運作的門檻。
開源模型不是DeepSeek發(fā)明的,但DeepSeek把開源人工智能推到前所未有的高度,并且提供了基本的開發(fā)工具包。相比之下,OpenAI、Anthropic、Google都是閉源的。
開源vs閉源,或者更加廣泛地說,開放架構(gòu)vs閉合架構(gòu),是信息科技發(fā)展史上幾番出現(xiàn)的主題。如今人們只說PC,已經(jīng)忘記IBM是PC架構(gòu)的開創(chuàng)者。差不多同時,蘋果推出自己的架構(gòu),其實還有Atari、Commodore、Next、Sparc等其他架構(gòu)。
最后,PC所代表的開放架構(gòu)勝出,因為開放架構(gòu)可以調(diào)動幾乎無限的資源,為相關(guān)生態(tài)添磚加瓦。這種乘數(shù)效應(yīng)是靠一己之力的閉合架構(gòu)無法比擬的。開放架構(gòu)與寄生開發(fā)是共生、共榮的。
人工智能生態(tài)的一部分。開源的活躍性和包容性將進(jìn)一步擴(kuò)大人工智能生態(tài)的影響,使得中國成為世界新科技的中心這對美國霸權(quán)而言,是巨大的危險。
開源也意味著新經(jīng)濟(jì)。比如說,私用的購物和生活小幫手需要海量的公域數(shù)據(jù),每人每家的小幫手都到網(wǎng)上“搜刮”差不多的數(shù)據(jù),這是巨大的浪費,也是巨大的成本。專業(yè)的“公域數(shù)據(jù)批發(fā)商”可能應(yīng)運而生,集中“搜刮”公域數(shù)據(jù),提供云服務(wù),用于訓(xùn)練私用小模型。
相關(guān)的小模型訓(xùn)練也會應(yīng)運而生,好比人工智能時代的云上“馴狗師”,幫助個人用戶訓(xùn)練、調(diào)整、更新私用小模型。
一方面,這依然把隱私和數(shù)據(jù)自主交給了“別人”,另一方面,這個“別人”是自己可選的,而不像平臺,沒得選。如果有足夠的自信和技能,自己動手也可以,那就沒有“別人”的問題了。
小模型和大模型也是相輔相成的,這是自駕和公交的關(guān)系,不是相互替代的關(guān)系。
人工智能可能意味著顛覆性的科技發(fā)展,意味著全新賽道,意味著重新洗牌和重拉起跑線。在航空科技的歷史上,噴氣時代就是這樣的顛覆性時刻。
蘇聯(lián)航空科技的啟動很早,但由于科技實力和綜合國力差別,直到二戰(zhàn)時代,蘇聯(lián)航空科技的水平仍不及歐美。但在噴氣時代的重新洗牌中,蘇聯(lián)一躍而進(jìn)入第一梯隊,米格-15和F-86打得有聲有色,同時代的歐洲噴氣機(jī)落后了?隙〞腥艘悦赘-15用羅爾斯-羅伊斯“尼恩”發(fā)動機(jī)來說事,且不說米格-15用的是蘇聯(lián)自己的改進(jìn)型,他們應(yīng)該說說英國為什么沒有用“尼恩”造出至少和米格-15一樣好的戰(zhàn)斗機(jī)。
從這里開始,蘇聯(lián)航空的輝煌一直延續(xù)到冷戰(zhàn)結(jié)束,蘇-27的篇章至今在中國續(xù)寫。
蘇聯(lián)科技決策錯誤使得蘇聯(lián)錯過了戰(zhàn)后更加廣泛深刻的電子科技和數(shù)字革命,經(jīng)濟(jì)和科技的過度軍事化最終限制了顛覆性時刻在更大層面上開花結(jié)果。
中國是完全不同的情況。寬廣、深厚、堅實的科技和制造業(yè)基礎(chǔ)提供了土壤,龐大、勤勞、聰明的人口提供了水分,以民為本、“發(fā)展是硬道理”的政策提供了陽光,和平崛起、共同發(fā)展的基本國策提供了空氣,顛覆性的科技革命就成為種子,重新洗牌和重拉起跑線就是歷史性的起飛時刻。
浙江大學(xué)碩士,2008年畢業(yè)后留在杭州創(chuàng)業(yè),2015年創(chuàng)立對沖基金“幻方量化”,2019年成為中國首家突破千億元人民幣的私募量化大廠。2023年全球AI熱潮爆發(fā),梁文鋒宣布轉(zhuǎn)變賽道,同年7月成立DeepSeek。
在他的旗下,匯集了一支小而精的隊伍,139名研究人員大多由中國本土培養(yǎng),其中許多是清華、北大應(yīng)屆畢業(yè)生甚至在讀生。據(jù)說,Deepseek“只招1%的天才,去做99%中國公司做不到的事情”。
梁文峰的成就,打破了人們“非北清不能出人才”的迷思。DeepSeek確實招募了很多北清的人,但主心骨并不來自北清。梁文峰是浙大的,按照“第一學(xué)歷為王”的思路,被小米用1000萬年薪挖走的羅福莉是北師大的。北清復(fù)交浙科等C9都是中國的頂級名校,但在這小圈子之外,還有更多的優(yōu)秀高校,有更多的優(yōu)秀人才,不要被“藍(lán)籌股”思維蒙住眼睛,而是需要“藍(lán)海股”思維。
OpenAI等“傳統(tǒng)人工智能”團(tuán)隊走所有問題一視同仁的大一統(tǒng)路線,典型大模型有多達(dá)1.8-2萬億個參數(shù),訓(xùn)練時要對這些參數(shù)統(tǒng)統(tǒng)調(diào)整,解算時也需要數(shù)據(jù)在所有這些參數(shù)中“走一遍”,算力要求可想而知。
DeepSeek采用化整為零、化零為整的思路,將巨大的問題分解為既相關(guān)又獨立的子問題。較小的子問題只需要較小的模型,但在頂層,有另一個“交通指揮模型”將需要求解的問題導(dǎo)向相關(guān)的小模型,對“跨界”的問題則調(diào)用若干相關(guān)的小模型,并根據(jù)與各子問題的相關(guān)程度協(xié)調(diào)子模型之間的解。因此,模型只有6710億個參數(shù),而且任何時候都只有不超過370億個參數(shù)激活。這是Deepseek可以用較小算力訓(xùn)練和解算的關(guān)鍵。
這不僅再次說明“蠻干不如巧干”的道理,也說明在科技發(fā)展出現(xiàn)顛覆性變化的時候,“世界是平的”,輝煌屬于有想法、有準(zhǔn)備的人,而并不一定只屬于大廠、國家隊;梅搅炕谌斯ぶ悄芊矫嬷哺痪,但此前從事的高頻率交易對計算效率的要求很極端,所以在大模型“巧算”方面的成功并不偶然。中國肯定需要華為這樣的大廠,也需要科學(xué)院這樣的國家隊,但DeepSeek這樣并無業(yè)界背景的小廠不僅有機(jī)會,還放了一個原子彈。
深厚積累永遠(yuǎn)是有用的,但在顛覆性的時代,抓住當(dāng)下、勇于創(chuàng)新更重要,這本來就是重拉起跑線的意義。尤其應(yīng)該注意的是,機(jī)會常常與困難并存,需要的是珍視機(jī)會,不要被困難嚇住。在30年前,“下!笔羌润@心動魄又振奮人心的時刻,那是“繁花”的時代,也是大下崗的時代;現(xiàn)在又是“下!钡臅r刻,是“銀杏葉”和DeepSeek的時代,也是躺平的時代。30年前下海需要的本錢是資金和關(guān)系,現(xiàn)在下海需要的本錢更是知識和前瞻。
在“繁花”時代,人們前赴后繼地下海,是看到前人成功,激起“我也能”的自信。在人工智能時代,DeepSeek是個好榜樣,希望能激起更多初創(chuàng)科技企業(yè)的產(chǎn)生,并在融資市場上得到更多的支持。中國制造業(yè)已經(jīng)產(chǎn)生一大批“小巨人”,中國科技也需要一大批“小巨人”。