Web3天空之城城主
先聲明一下,以免有同學(xué)認(rèn)為標(biāo)題后半段過于聳人聽聞,這是一個直接的引用,來自于一位美國學(xué)者的視頻《DeeSeek不僅在顛覆人工智能領(lǐng)域,也正在撼動美國資本主義》,視頻可以在本城B站觀看:https://b23.tv/dYalmTH
視頻內(nèi)容不長,文字版先行附上:
"DeepSeek是一家中國人工智能公司,正在挑戰(zhàn)美國資本主義的模式。美國經(jīng)濟(jì)與大型科技公司緊密相連,沒有它們,經(jīng)濟(jì)增長將極其有限,股市也幾乎不會增長。美國經(jīng)濟(jì)的繁榮神話,很大程度上建立在股市屢創(chuàng)新高,而這主要得益于人工智能的炒作價值。
然而,DeepSeek以少量資金,開發(fā)出似乎優(yōu)于ChatGPT的AI模型。它能出色地回答問題,但卻采用了一種與眾不同的方法:不使用英偉達(dá)的高科技芯片,能耗遠(yuǎn)低于后者,且基于更廉價的大型語言模型。
DeepSeek的作為具有深刻的顛覆性,動搖了美國資本主義的根基。美國資本主義基于三個核心理念:首先,最大限度地保護(hù)發(fā)明,將財富集中于少數(shù)人手中,造就了“科技兄弟”以及相關(guān)的財富分配不均;其次,盡可能地反競爭,專利律師成為核心角色,通過法律手段阻礙競爭,從而維持高價;第三,由于缺乏競爭,導(dǎo)致效率低下,沒有動力降低成本。
你財力雄厚,可以隨意揮霍,擁有舒適區(qū),讓很多人為你工作,即便他們并非必需,你仍然能申報巨額利潤,感覺像城堡之王,享受員工的感激之情。因此,你缺乏精簡、強(qiáng)硬和高效的動力,這與市場資本主義的理想背道而馳,尤其在美國更是如此。
DeepSeek粉碎了這些神話。它成本低廉,市場策略迥異,甚至開源了源代碼,任何人都可訪問和使用,這與美國模式截然相反。它并非設(shè)置法律障礙,而是開放共享,雖然它依然會對大型語言模型和答案收費(fèi),但價格遠(yuǎn)低于美國公司。
這得益于其低端技術(shù)和更低的能耗。這實際上推翻了特朗普當(dāng)選前流行的投資策略,該策略認(rèn)為數(shù)十億美元投資人工智能將帶來增長,從而讓特朗普繼續(xù)執(zhí)政。
然而,事實并非如此。人們不禁懷疑,這是否是中國政府為削弱特朗普潛在關(guān)稅戰(zhàn)而精心策劃的時機(jī)。我確實有這種懷疑,所以坦言之。但DeepSeek確實有效,我見過它生成的優(yōu)秀內(nèi)容。
無論這是否是中國政府的策略,DeepSeek都成功擾亂了美國人工智能市場,甚至可能阻止美國獲得該領(lǐng)域的全球壟斷地位,如同微軟、谷歌和推特等公司所享有的那樣。如果DeepSeek及其中國競爭對手能創(chuàng)造出與OpenAI、微軟、谷歌等公司高成本產(chǎn)品截然不同的產(chǎn)品,那么人工智能領(lǐng)域的壟斷趨勢可能無法復(fù)制。
我不知道這將走向何方,也無法預(yù)測,我相信其他人也無法預(yù)測。這可能只是一場小風(fēng)波,但讓我們假設(shè)并非如此。如果DeepSeek的成功屬實,那么特朗普對美國市場的號召所建立的整個基礎(chǔ)將被摧毀。
更深層次的是,如果以人工智能及其潛力為基礎(chǔ)的美國經(jīng)濟(jì)力量被摧毀,那么特朗普建立以關(guān)稅壁壘為后盾的孤立主義美國的計劃也將不復(fù)存在。DeepSeek的意義遠(yuǎn)超其作為AI模型的優(yōu)劣,它正在挑戰(zhàn)美國資本主義的核心,以及美國右翼的哲學(xué)核心。
中國政府是否選擇在特朗普政府上任伊始破壞這些意識形態(tài)并不重要,因為它無論如何都會這么做。
這可能產(chǎn)生巨大影響。
DeepSeek在AI圈的震蕩還在繼續(xù)。
而且,看不到結(jié)束!
--
這幾天DeepSeek給予美國的大地震仍然在繼續(xù),看不到結(jié)束。
讓我們中立一點, 先不對美國資本進(jìn)行什么評論。但肉眼可見的是,DeepSeek正在分化美國科技巨頭。
DeepSeek黑天鵝出來之后, 首先著急跳出來的就是OpenAI和Anthropic兩小強(qiáng)。
OpenAI的表態(tài)還是相對含蓄的,甚至在今天,OpenAI被迫提前發(fā)布了GPT O3-mini后,奧特曼在線上問答中非常坦誠在表示過去自己可能選錯了方向,他承認(rèn): DeepSeek 減弱了 OpenAI 在人工智能領(lǐng)域的領(lǐng)先地位,OpenAI 在開源其技術(shù)方面“站在了歷史的錯誤一邊”。需要“ 找出一種不同的開源策略,”奧特曼還說:“并不是所有 OpenAI 的人都持這種觀點,這也不是我們目前的最高優(yōu)先事項……我們將會推出更好的模型,但我們將保持的領(lǐng)先優(yōu)勢將比以前幾年少!
這個表態(tài)對于一心閉源要搞商業(yè)化的奧特曼來說是不同尋常的。特別是最近OpenAI被曝出正在進(jìn)行新一輪數(shù)百億美金融資。
更有意思的是Anthropic,其創(chuàng)始人CEO Dario Amodei發(fā)了長篇文章回應(yīng)。Dario作為前OpenAI首席科學(xué)家,號稱因不滿OpenAI的封閉而自立門戶,在以往的訪談里, Dario都以(相對OpenAI)偉光正的科學(xué)家形象出現(xiàn),以打造安全性AI作為自己公司的標(biāo)簽,作為估值超高且唯一能和OpenAI掰手腕的AI大模型創(chuàng)業(yè)公司,Anthropic一直都是資本的香饃饃,特別是錯過了OpenAI的AWS和Google,之前基本上搶著給Anthropic送錢,只為了搭上AI大模型這趟車。
在這篇萬字長文里,Dario不再提如何讓AI普惠人類,不再談人類文明共同進(jìn)步,而是強(qiáng)調(diào)要加強(qiáng)對中國的芯片和顯卡管制,要如何限制中國AI大模型發(fā)展,要把AI的領(lǐng)導(dǎo)權(quán)留在美國。
感覺他急了。
這篇文章實在有點酸,以至于和Anthropic有密切聯(lián)系的開源社區(qū)HuggingFace創(chuàng)始人直接在X上噴這篇文章實在讓人“讀得很痛苦”。
對此城主只能評論,DeepSeek直接扯下了Anthropic的面具。
如外文評論,DeepSeek的出現(xiàn),最大的輸家莫過于Anthropic,OpenAI好歹手里還有推理模型o系列,最強(qiáng)的滿血版o3盡管推理成本奇高,但還是地球最強(qiáng)- 雖然不知道這個最強(qiáng)還能維持多久。Anthropic可是完全沒有公開的推理級大模型的,在這個CEO出來發(fā)酸文的同時,Anthropic內(nèi)部技術(shù)人員大概率在捧著DeepSeek無私共享的論文拼命復(fù)現(xiàn)R1。由于DeepSeek發(fā)布了頂級推理模型的技術(shù)原理,可以想見Google,微軟,AWS,meta這些巨頭的技術(shù)部門都在如獲至寶的依照論文打造自己的推理大模型,在這種局面下,沒有拿出推理大模型的Anthropic在AI界的地位就真的很尷尬了,Dario估計在煩惱,如何繼續(xù)講好自己公司那么高估值的故事。
之前城主文章有提到過,盡管OpenAI和Anthropic官方都防中國人使用,但程度是不一樣的,OpenAI的頁面和API只需要簡單的翻個墻就可以用了;Anthropic對疑似來自中國的用戶的封禁措施只能用發(fā)指來形容,是城主見過的最夸張的封禁措施;無責(zé)任猜測,Anthropic應(yīng)該是用上了自家AI來幫助分析封禁。同時,據(jù)傳Anthropic內(nèi)部絕對禁止和中國人交流。所以在DeepSee V3和Claude3.5 Sonnet并駕齊驅(qū),且R1妥妥超越之后,Anthropic CEO肉眼可見的著急和口不擇言是可以理解的
但撕下了面具,以后帶上就難了;旧峡梢栽u論,Anthropic只是一個被資本劫持,被DeepSeek懟得有點慌張的AI先行既得利益者而已。(以上歡迎Anthropic內(nèi)部人士來指正)
而對于大公司, 就更有趣了。
最新的消息是各大科技巨頭,包括微軟Azure, AWS,NVIDIA,都第一時間在自己的云服務(wù)部署提供了DeepSeeek R1服務(wù)。
打不過,就加入。真香定律誰也逃不過。
微軟這一邊還號稱在調(diào)查DeepSeek是否從OpenAI“盜竊”數(shù)據(jù),一方面自己就部署上了。這個做法不敢說滑稽,只能說真香。首先需要明確指出,某些美媒所謂的‘盜竊數(shù)據(jù)’只是又一個慣用的混淆視聽的輿論做法罷了。作為大模型訓(xùn)練慣例的“蒸餾’(即利用了其他模型的公開輸出作為訓(xùn)練數(shù)據(jù) -- 況且DeepSeek有沒有,用了多少都沒有任何定論,全在猜測)和盜竊企業(yè)內(nèi)部保密數(shù)據(jù)是本質(zhì)的區(qū)別的。
美國網(wǎng)友就直接嘲諷,OpenAI恐怕忘記了自己還身背多個指控,未經(jīng)許可非法使用《紐約時報》,油管視頻等數(shù)據(jù)來進(jìn)行自家大模型訓(xùn)練。
當(dāng)然,我們不能以一方的瑕疵去證明另外一方的正確與否。只是,微軟一方面指責(zé)DeepSeek R1可能有問題,一方面又怕被搶了API生意趕緊部署在自家Azure云上,這一手就略有喜感了。
然后看看NVIDIA。如果說周一納斯達(dá)克因為DeepSeek載入史冊的大跌是反應(yīng)過度,這幾天NVIDIA的股價卻并沒回升-- 而是一直呈現(xiàn)反復(fù)掙扎之態(tài),昨晚繼續(xù)跌了4%,維持在了DeepSeek黑天鵝后的低位120美金。
平心而論,NVIDIA的芯片+CUDA生態(tài)在相當(dāng)時間里仍然是獨一份,但或許這正是這兩天NV還在低位的根本原因 - 根據(jù)最新的論文解讀,DeepSeek為了在H800這個性能一般的GPU上訓(xùn)練大模型,甚至直接繞過了CUDA這個NVIDIA的軟件層,直接使用了類似CPU匯編語言的NV硬件編程語言來操作GPU,做出了非同一般的深度優(yōu)化。
這個事情的意義有點深。NVIDIA的護(hù)城河是什么,絕對不是GPU硬件本身,而是構(gòu)建在GPU之上的CUDA軟件生態(tài)。業(yè)界絕大部分的AI訓(xùn)練推理都深度依賴于CUDA軟件層 -- 這也是AMD如此痛苦的原因,即便生產(chǎn)出了同一級別的GPU, 做AI的大模型企業(yè)和個人用戶也不愿意選擇AMD,無他,因為大家都需要在CUDA上運(yùn)行大模型的訓(xùn)練和推理。
AMD也不是沒想過辦法,不就是軟件嗎,只要能兼容CUDA的API接口就可以了。在此前AMD還真的這么做了,利用開源社區(qū)開發(fā)的CUDA兼容層二次開發(fā)以讓自家GPU硬件在軟件層兼容CUDA,結(jié)果是,被NVIDIA告了。。。
那些炒作NVIDIA黃仁勛和AMD蘇姿豐是親戚的帖子毫無意義,這兩家基本上水深火熱著呢,無怪乎蘇姿豐最近直接和媒體說,和黃仁勛關(guān)系太遠(yuǎn),不熟。
而現(xiàn)在, DeepSeek拋開了CUDA,直接使用底層GPU匯編語言實現(xiàn)了最頂級大模型的訓(xùn)練。這簡直就是AMD的天賜良機(jī),AMD已經(jīng)第一時間官方發(fā)布新聞,宣稱在自家GPU硬件上跑DeepSeek R1比在Nvidia 硬件更快。
GPU硬件的體系架構(gòu)基本上是大同小異的,硬件之間的一點點差別, 完全可以依靠底層匯編語言彌補(bǔ) - 因此Windows DirectX才有可能統(tǒng)一所有顯卡圖形接口呢。而現(xiàn)在,DeepSeek團(tuán)隊被逼著使用底層匯編語言來操作GPU硬件, 硬生生的在CUDA生態(tài)上撕開了一道口子,這對NVIDIA無疑是個公關(guān)的晴天霹靂。在DeepSeek之前我們基本沒聽說過這種操作,一來沒必要,二來團(tuán)隊的水平一般也做不到這點。NVIDIA對這個事件估計沒有任何思想準(zhǔn)備,但幻方做到這么極致也不意外,做量化交易的公司,對性能和延時等都極度敏感,往日的技術(shù)積累再加上被嚴(yán)格限制的芯片,使用更底層的算法實現(xiàn)性能的最大程度壓榨非常理所當(dāng)然。如果沒有美國的限制,DeepSeek大概率不會在如此的規(guī)模上率先實現(xiàn)這種壯舉。
當(dāng)CUDA不再成為壁壘,高興的顯然不止是AMD,國產(chǎn)GPU芯片也終于看到曙光。如果最終大規(guī)模的模型訓(xùn)練和推理都可以在底層匯編語言上實現(xiàn),而不依賴于CUDA,美國對中國的算力封堵,是否問號變得更大了呢。
華爾街的眼睛還是很犀利的,NVIDIA的困境顯然被看在資本的眼里,這恐怕也是為什么NVIDIA的股價被打壓之后未能直接恢復(fù)的原因了。如果美國繼續(xù)芯片封堵的政策,可以想見,國產(chǎn)算力環(huán)境CUDA替代化的運(yùn)動必將如火如荼的展開,當(dāng)走到這一步,美國恐怕就真把NVIDIA坑慘了。
所以此前黃仁勛上了新聞的不參加總統(tǒng)就職典禮,也算是一個明確的態(tài)度,和米國zf芯片封堵的政策劃清界限。
城主對NVIDIA和黃仁勛還是很佩服的,也希望NVIDIA能繼續(xù)好好的對國內(nèi)做生意。(5090D這種直接鎖算力不讓運(yùn)行AI計算的垃圾就不要賣到中國了。)
在大廠里,Google其實是當(dāng)下最舒服的一家,Google不像微軟那么尷尬,一手要安撫OpenAI一手還要登上DeepSeek R1這艘船,搞得自己打臉。G家完全可以基于自家Gemini AI模型的研究基礎(chǔ),利用DeepSeek發(fā)布的論文實現(xiàn)自家的推理模型,按照G家的技術(shù)實力, 應(yīng)該很快。微軟本來也有這個本事,無奈自家模型還不太爭氣,恐怕AI團(tuán)隊建設(shè)比G家也差了一些,同時,微軟的AI領(lǐng)導(dǎo)人穆斯塔法和G家的AI掌門人諾獎得主Demis Hassabis 雖然同出自DeepMind,但在技術(shù)管理水平上是否還有差距。在這個開卷考試(拿著DeepSeek論文去復(fù)刻)中,城主認(rèn)為G家大概率是獲勝的,我們不妨拭目以待。
聲勢浩大的上線DeepSeek R1的還有AWS。對于亞馬遜而言,這毫無疑問也是一個好機(jī)會。在此之前,AWS僅依靠Anthropic的Claude API在大模型市場上占了一小塊版圖,如不是花大價錢投資Anthropic換來了在AWS上的Claude API部署,AWS在AI時代就真挺尷尬的。現(xiàn)在AWS第一時間上線DeepSeek R1的動機(jī)非?梢岳斫,畢竟這是唯一一個可以和競爭方OpenAI o1/o3推理模型掰手腕且性價比超高的大模型,哪一家云廠商沒有提供這個模型, 就意味著在AI云業(yè)務(wù)上失去了一大塊競爭力;這一點,無論如何云業(yè)務(wù)負(fù)責(zé)人都不可以接受。因此,作為Anthropic重要股東的AWS義無反顧要上線DeepSeek R1,作為OpenAI重要股東的微軟Azure也要上線R1,即使要打臉自己手中的重要棋子,也必須要這么做,沒有選擇。
而同為開源旗手的Meta呢?如大家所看到的傳聞,Meta內(nèi)部已經(jīng)焦灼萬分,一方面要努力研究和復(fù)刻R1,一方面要想辦法和董事會解釋GenAI部門的高薪合理性,這個段子網(wǎng)上文章很多,就不重復(fù)了。無論如何,對于Meta開源Llama,城主是表示敬佩的,在很長時間里,DeepSeek沒出來之前,這是開源AI社區(qū)最大的旗幟。Meta開源的方向沒有什么可吐槽的,可能唯一的問題只是在投入產(chǎn)出比之上了。
總而言之,對于美國科技巨頭而言,針對DeepSeek的“國家安全”敘事看來無法影響任何科技巨頭使用DeepSeek R1;在巨大的資本利益面前,“國家安全”的敘事顯然是無力和蒼白的。美科技巨頭的反應(yīng),無論是指責(zé)DeepSeek的數(shù)據(jù)使用的"問題"還是第一時間搶先部署DeepSeek R1服務(wù),甚至還有針對DeepSeek的來自美國的大規(guī)模網(wǎng)絡(luò)攻擊。所有的一切不外乎一個目的,就是維護(hù)美AI科技的領(lǐng)先地位,從而保證這一波以AI為基礎(chǔ)的美國科技資本安全。
DeepSeek的故事還在繼續(xù),這個注定載入科技史的事件會發(fā)展到什么程度,我們都是幸運(yùn)的見證者。