好好好,本以為 OpenAI 直播已經(jīng)是 24 年 AI 領(lǐng)域的尾聲,沒(méi)想到還有高手,國(guó)內(nèi) AI 圈又傳出個(gè)大新聞。
就在前幾天,國(guó)產(chǎn) AI 六小虎中的階躍星辰,拿到了數(shù)億美元的融資。
而且更值得一提的是,這輪融資的背景可不簡(jiǎn)單,差評(píng)君還從投資方里找到了上海國(guó)資的身影。
要知道就在幾天前,北京國(guó)資也投了六小虎中的另一家智譜。
一南一北兩大超級(jí)城市,各自押寶,都上了賭桌。
有一說(shuō)一,經(jīng)過(guò)前段時(shí)間的 “ 百模大戰(zhàn) ” , AI 在融資圈兒其實(shí)是有些降溫的,結(jié)果這次兩大國(guó)資先后出手:
這一波,難不成是大模型版的滬爺 VS 京爺?
雖然話(huà)是這么說(shuō),估計(jì)一些網(wǎng)友還是對(duì) “ 階躍星辰 ” 的名字有點(diǎn)陌生, “ 這又是從哪冒出的大模型公司? ”
但其實(shí)在圈兒內(nèi),階躍星辰早就小有名氣,不過(guò)倒也不怪大家沒(méi)聽(tīng)過(guò),主要這企業(yè)確實(shí)比較低調(diào)。
相對(duì)其他AI 創(chuàng)業(yè)公司,階躍是六小虎里最后出場(chǎng)的,但在登場(chǎng)時(shí),就已經(jīng)是獨(dú)角獸的存在了。
如果要用一句話(huà)來(lái)形容的話(huà),差評(píng)君能想到的就是 “ 低調(diào)神秘有實(shí)力,國(guó)資背景大牛多 ” ,是國(guó)產(chǎn) AI 里的一匹黑馬。
不僅在首秀時(shí),階躍星辰就掏出了個(gè)對(duì)標(biāo) GPT-4 的萬(wàn)億參數(shù)模型,而且主打一個(gè)速度快、效率高, 10 個(gè)月內(nèi)就發(fā)布 11 款模型,并且在 16 個(gè)月內(nèi),就搗騰出了從理解到生成的全系列模型矩陣。
雖然人家確實(shí)挺有實(shí)力,不過(guò)咱這次的重點(diǎn)倒不是純講這個(gè)。
差評(píng)君覺(jué)得借著拿階躍星辰融資這事,還是有挺多有意思的 AI 圈內(nèi)故事,能和大家聊聊的。
首先不可否認(rèn)的是,大模型領(lǐng)域?qū)嶋H已經(jīng)在縮決賽圈兒了。
差評(píng)君也和不少圈內(nèi)人聊了聊,發(fā)現(xiàn)大家基本都在從兩個(gè)點(diǎn),來(lái)判斷這家公司有無(wú)能吃雞的冠軍相。
一個(gè)是有沒(méi)有牛逼的人才,另一個(gè)是能不能堅(jiān)持投入技術(shù)研發(fā)搞 AGI 。
咱先說(shuō)人才,其實(shí)大模型的人才圈兒,可能比差評(píng)君的朋友圈還小。
就拿今年諾獎(jiǎng)得主喬弗里辛頓來(lái)說(shuō),他這個(gè)深度學(xué)習(xí)之父的實(shí)驗(yàn)室,一向就是各大公司眼中的頂級(jí)宗門(mén)。
像什么 OpenAI 聯(lián)合創(chuàng)始人伊利亞,就是他的博士;谷歌 DeepMind 的大佬阿列克謝,是他的博士后;
Meta 的人工智能負(fù)責(zé)人楊立昆也是他的弟子;前百度首席科學(xué)家吳恩達(dá),也跟他有千絲萬(wàn)縷的關(guān)系。
而在國(guó)內(nèi),被北京國(guó)資選中的智譜 AI ,實(shí)際上也是學(xué)術(shù)上的大宗門(mén)出身,直接來(lái)自有 27 年人工智能研究歷史的清華大學(xué)知識(shí)工程實(shí)驗(yàn)室。
所以說(shuō),有沒(méi)有這些牛逼人才,往往是行業(yè)內(nèi)認(rèn)不認(rèn)可一家公司的理由之一,甚至有時(shí)候請(qǐng)這些圈內(nèi)大牛,要比花錢(qián)買(mǎi)顯卡搞計(jì)算還重要。
前不久,差評(píng)君就和某大模型一線(xiàn)技術(shù)人員聊了聊,他用前不久字節(jié)高薪挖阿里通義大模型技術(shù)負(fù)責(zé)人周暢的新聞舉例,告訴差評(píng)君目前圈內(nèi)人才急缺。
他覺(jué)得傳聞中花費(fèi) 8 位數(shù)薪資挖人的操作,是可以理解的。
因?yàn)榇竽P陀?xùn)練成本動(dòng)不動(dòng)就是幾千萬(wàn)上億,而合適的人才,能少走很多彎路,反而是最省的操作。
而這次的階躍星辰,差評(píng)覺(jué)得它能被資本看好,也和人才脫不了干系。。。
不過(guò)與學(xué)院派京爺智譜不同,滬爺階躍這方面也很特色,很多人都是行業(yè)內(nèi)老人了。
他們里面很多研究人員都是從讀博士開(kāi)始搞相關(guān)領(lǐng)域,然后在大廠工作過(guò),親身在一線(xiàn)經(jīng)歷了過(guò)去 10 年 AI 的最前沿發(fā)展。
比如階躍星辰的創(chuàng)始人、CEO 姜大昕,這哥們以前是微軟前全球副總裁,日活上億、備受差友們喜歡的 Bing 搜索,還有全球最早的智能個(gè)人助理 Cortana ,都是他曾參與過(guò)的項(xiàng)目。
這么說(shuō)吧,他把深度學(xué)習(xí)技術(shù)應(yīng)用到了 Bing 上,幫助 Bing 搜索服務(wù)擴(kuò)展到全球 200 多個(gè)國(guó)家和地區(qū)。
除了CEO ,階躍的首席科學(xué)家張祥雨,在這個(gè)圈子里也很有名。
這老哥本來(lái)是西交跟微軟亞洲研究院的博士生,師從孫劍和何愷明,還是開(kāi)山大弟子。
但這還不是重點(diǎn),重點(diǎn)在于讀博期間,他們師門(mén)四人完成了引用次數(shù)幾十萬(wàn)、本世紀(jì)最火的深度學(xué)習(xí)著名論文 ResNet ( 殘差學(xué)習(xí) ),而張祥雨在里面就負(fù)責(zé)了底層框架和編碼。
有的差友可能不了解這個(gè) ResNet ,沒(méi)關(guān)系,重點(diǎn)就一句話(huà),這文章的核心思想殘差網(wǎng)絡(luò),對(duì)現(xiàn)代深度學(xué)習(xí)影響巨大。
當(dāng)年打敗八冠王捷豹的 AlphaGo 系列,就用了 ResNet 技術(shù);現(xiàn)在的 Transformer 網(wǎng)絡(luò)( GPT 里那個(gè) T )里,同樣也用了殘差網(wǎng)絡(luò)。
除了這個(gè),張祥雨在其他技術(shù)上也很牛逼,在這咱就不細(xì)說(shuō)了。就說(shuō)一個(gè)蘋(píng)果的 3D 人臉解鎖,也就是 FaceID ,那其實(shí)也是受他的 ShuffleNet 技術(shù)影響才搞出來(lái)的。。。
總之,這個(gè) 2023 年 4 月才建立的團(tuán)隊(duì),在六小虎里亮相最晚,但人才的實(shí)力卻絲毫不虛,從這點(diǎn)上看,能拿到魔都的投資也不算奇怪。
然而另一方面,除了人才以外,大模型廠商路線(xiàn)的選擇,也越來(lái)越受重視。
而 AGI 基座模型這方向,其實(shí)也是技術(shù)理想主義者們最興奮的方向,是大部分創(chuàng)業(yè)者入局大模型領(lǐng)域的初心所在。
換句話(huà)說(shuō),基座大模型就是那一層地基,只有地基扎實(shí)了,模型的基礎(chǔ)能力逐漸提升了,才有可能在未來(lái)搞出能真理解世界的通用模型,并運(yùn)用到各種場(chǎng)景中改變?nèi)藗兊纳睢?br/>
像是 OpenAI 、 Google 、 Anthropic 、 Meta ,還有國(guó)內(nèi)的智譜、階躍等,就屬于這一派,在堅(jiān)持推出各類(lèi) AI 應(yīng)用的同時(shí),也依舊在基座大模型的探索上越走越遠(yuǎn)。
然而就像開(kāi)頭說(shuō)過(guò)的,整個(gè) AI 領(lǐng)域其實(shí)有些降溫。
不少初創(chuàng)廠商們因?yàn)槌杀旧系膲毫,逐漸擱置了基座大模型的研究和探索,把重心放在 AI 應(yīng)用上。
要么轉(zhuǎn)向垂直行業(yè)賽道、要么單純搞 toC 的生意來(lái)賺錢(qián),畢竟要先活著才能去實(shí)現(xiàn)理想。
而在 2024 年,國(guó)內(nèi)依舊在不斷更新基座模型,依舊在公開(kāi)場(chǎng)合重申 AGI 為最終目標(biāo)的公司里,智譜和階躍星辰算是很典型的代表了。
幾個(gè)月前,差評(píng)編輯部就跟智譜的 CEO 張鵬對(duì)話(huà)過(guò)。張鵬表示:我們的目標(biāo)定在 AGI ,這里面每一個(gè)問(wèn)題的突破都有可能帶來(lái)飛躍式的發(fā)展。
包括階躍星辰也一樣,階躍的創(chuàng)始人姜大昕曾經(jīng)說(shuō),高昂的訓(xùn)練成本的確是一個(gè)挑戰(zhàn)。有人調(diào)侃 “ 講卡傷感情,沒(méi)卡沒(méi)感情,用卡費(fèi)腦筋 ” ,但如果追求的目標(biāo)就是 AGI 的話(huà),付出再多也還是要堅(jiān)持下去。
姜大昕給階躍星辰設(shè)計(jì)的技術(shù)路線(xiàn)中,就分成 “ 單模態(tài) - 多模態(tài) - 多模理解和生成 - 世界模型 -AGI” ,一共五個(gè)步驟。
這可能也是階躍的大模型系列之所以被命名為 Step 的原因,五步成詩(shī)。
到了現(xiàn)在,階躍星辰已經(jīng)走出了兩步。
階躍的第一步,就是萬(wàn)億參數(shù)大模型 Step-2 ,它在上個(gè)月就炸場(chǎng)了一番。
在圖靈獎(jiǎng)得主楊立昆親推的權(quán)威榜單,有 “ 全球最難大模型評(píng)測(cè) ” 之稱(chēng)的 LiveBench 上,Step-2 拿下了國(guó)內(nèi)第一、總榜第五的成績(jī),成了唯進(jìn)前名的中國(guó)語(yǔ)模型。
榜單成績(jī)時(shí)間:2024-11-19
而階躍的 “ 第二步 ”Step-1V 走的也不錯(cuò)。
拿模型競(jìng)技場(chǎng) Chatbot Arena 的數(shù)據(jù)來(lái)看,這個(gè)競(jìng)技場(chǎng)網(wǎng)站里網(wǎng)友們可以試用所有的大模型,然后給它們打分,今年 11 的榜單里 Step-1V 的總分已經(jīng)達(dá)到了 Gemini1.5 的水平。
除了這些,在 C 端應(yīng)用上這家公司也做出過(guò)一些出圈的產(chǎn)品,就比如主打拍照識(shí)別的躍問(wèn) app 。
他家的躍問(wèn)拍照問(wèn),也是最早接入 iPhone 16 相機(jī)控制的國(guó)產(chǎn)大模型功能。
還有一上線(xiàn)就快速?zèng)_上 App Store 美食榜前三的胃之書(shū),用的就是階躍的多模態(tài)大模型;
今年在圈內(nèi)爆紅的AI 小游戲換你來(lái)當(dāng)?shù)㈧`魂提取器,也是基于階躍模型能力開(kāi)發(fā)出來(lái)的。
像是界面財(cái)聯(lián)社這些財(cái)經(jīng)垂類(lèi)的專(zhuān)業(yè)媒體,也跟階躍做過(guò) AI 合作。
但歸根結(jié)底,階躍星辰給人最深的感覺(jué),還是在低調(diào)有實(shí)力,和堅(jiān)持著 AGI 初心這兩點(diǎn)上。
而這,或許就是上海國(guó)資之所以選擇它的另一個(gè)原因。
最后,差評(píng)君覺(jué)得在 AI 領(lǐng)域逐漸降溫的 2024 年末,智譜和階躍星辰兩家先后拿到了國(guó)家隊(duì)的投資,這對(duì)國(guó)產(chǎn) AI 行業(yè)來(lái)說(shuō)也是一個(gè)比較重要的信號(hào)。
一方面,這意味著行業(yè)內(nèi)的方向已經(jīng)開(kāi)始逐漸清晰,最頂端國(guó)家隊(duì)的層面,也希望能盡快看到 AGI 。
而另一方面,這也可以說(shuō)是拉開(kāi)了國(guó)內(nèi)大模型下半場(chǎng)的序幕:
擁有人才、找準(zhǔn)方向、能堅(jiān)持到最后的人,才有機(jī)會(huì)向人工智能的 One Piece AGI 進(jìn)軍。