三言科技2月4日消息,昨日,周鴻發(fā)文談到了DeepSeek能夠取得巨大技術(shù)突破的原因。
周鴻認為,首先人才策略上DeepSeek研究人員都是年輕人,且為國內(nèi)名校碩博畢業(yè)五年內(nèi)的。
其次,組織架構(gòu)上,是扁平研究的文化,DeepSeek團隊一百多人,就三層,梁文鋒、小組長和一線員工,并且很多組長不打績效,不會過度分工。
第三,梁文鋒對創(chuàng)新的渴求很高,鼓勵突破式創(chuàng)新。此外,DeepSeek用自己的錢,“不用看任何人臉色”。
第四,目標,DeepSeek最重要的是專注,它的資源很緊張,但是足夠聚焦。
以下是全文:
很多人問我說為什么deepseek能取得如此大的技術(shù)突破,以至于以一己之力撼動了全球的ai 工業(yè),讓美國政府大打出手。別的公司為什么研究不出來?
我覺得分成這么幾點吧。
第一,人才策略上,deepseek的研究人員是清一色的年輕人,都是國內(nèi)名校碩博畢業(yè)五年內(nèi)的。梁文峰也說過自己的招聘標準,聰明加熱愛,不要經(jīng)驗多的,與大廠要經(jīng)驗完全不同,沒有行業(yè)老人,沒有十年以上所謂的資深ai研究員。因為大模型17年才出來,國內(nèi)正式研究大模型23 年才開始,所以以前積累的所謂的人工智能經(jīng)驗,什么自然語言處理經(jīng)驗,基本都是負資產(chǎn)。很多大廠的老研究人員因為有歷史的包袱,還停留在哪里不懂就標注哪里的階段,沒有scaling規(guī)模化的理念。
不客氣的講,在巨大的技術(shù)變革面前,經(jīng)驗更多的是束縛,一張白紙加上第一性原理才是創(chuàng)新的源頭。
第二,組織結(jié)構(gòu)上,是扁平化研究的文化,deepseek團隊也就一百來人,就三層,梁文峰、小組長和一線員工,并且很多組長也不打績效,主要協(xié)調(diào)下面的資源,也不會過度分工,大家一起為最終模型的效果負責。日常都在一些群里討論,主打一個自由寬松的研究風格。
反觀互聯(lián)網(wǎng)大廠,一線到一把手少的五層多的八層,傳話就夠累的,更別提高效決策了。分工也分的特別細,就像我要吃個炒雞蛋,有人打蛋,有人切蔥花,有人倒油,有人架鍋,有人炒蛋,還有人端盤子。分工分的細呢就導致每個人都不對結(jié)果負責,每個人都要背一個自己的kpi,短期壓力很大,即使有能力也沒有勇氣創(chuàng)新,半年沒產(chǎn)出就要給你降級了。
那為什么創(chuàng)業(yè)公司也不行呢?那就要聊聊文化。
其實公司的文化核心就是老板的文化,在小公司更是如此。梁峰對創(chuàng)新的渴求很高,小創(chuàng)新他根本看不上,會鼓勵突破式創(chuàng)新。同時也親自為高風險負責,失敗了也不用你背鍋。而其他公司哪個老板能做到呢?
這里還有一個重要的點,deepseek用自己的錢,不用看任何人臉色,就不用被VC或者CEO牽著鼻子轉(zhuǎn),想咋干就咋干。所以一個懂技術(shù)、有理想、財富自由的老板才是核心。
第四個,目標,deepseek最重要的是專注。其實deepseek的資源是非常緊張的,應(yīng)該也就一萬來張卡吧,肯定不止兩千張卡了,但是它足夠聚焦。
其實這個也不是我總結(jié)的,是我在哪個群里看到的總結(jié),我就把它提煉了一下,感謝最早寫這個的朋友,這也值得我要去反思一下我們公司的人工智能策略。