「暗涌Waves」獲悉,3D生成模型領(lǐng)域公司VAST完成Pre-A輪融資,領(lǐng)投方為達(dá)晨財智和春華創(chuàng)投,英諾天使基、清華校友種基跟投。VAST表示,本輪融資額為數(shù)億元,創(chuàng)3D大模型賽道的最融資額。VAST也在去年6月獲綠洲資本的天使輪融資。“95后創(chuàng)業(yè)者”,“MiniMax001號”,這是常貼在VAST創(chuàng)始人宋亞宸身上的標(biāo)簽。2018年,還未畢業(yè)的宋亞宸開始在商湯CEO辦公室工作。2021年,他作為001號員工離開商湯、參與創(chuàng)立MiniMax。2022年9月29日,Google發(fā)布文生3D的技術(shù)DreamFusion,利用預(yù)訓(xùn)練的2D文本到圖像擴(kuò)散模型,提出SDS(Score Distillation Sampling)方法,首次完成開放域文本到3D的合成。VAST CTO梁鼎說,這標(biāo)志著3D AIGC真正進(jìn)入能夠應(yīng)用、有可能成為實(shí)際項(xiàng)目。2022年底,宋亞宸離開MiniMax,并于次年3月創(chuàng)立了VAST。和眾多AI創(chuàng)業(yè)者選擇應(yīng)用+社區(qū)的方向不同,宋亞宸選擇了難度最高的“自研模型+應(yīng)用”。目前團(tuán)隊(duì)百分之八十的開支用于技術(shù)團(tuán)隊(duì)與算力。據(jù)報道,作為AI四小龍之一的商湯,是員工入局大模型創(chuàng)業(yè)數(shù)量最多的企業(yè),成立公司包括MiniMax、無問芯穹、右腦科技、言圖智能以及VAST。VAST的CTO梁鼎也曾是商湯通用模型負(fù)責(zé)人。但SDS生成3D模型的方法存在缺陷,比如會出現(xiàn)模型“多頭”且生成速度慢。因此,VAST最終決定不走2D優(yōu)化路線,而是選擇2D3D融合路線。這意味著需要大量優(yōu)質(zhì)3D數(shù)據(jù)。和文字、圖片、視頻等消費(fèi)方式不同,3D數(shù)據(jù)極其匱乏,幾乎只能在游戲或電影中看到。作為一家創(chuàng)業(yè)公司,也完全無法接受單一模型幾十、甚至美金的高昂價格,“你只能各種軟磨硬泡去拿。”宋亞宸告訴「暗涌Waves」。2023年3月開始,他花了三個月在各種“犄角旮旯”(比如3D建模培訓(xùn)班)搞數(shù)據(jù),也和游戲、動畫、影視、模型、社區(qū)包括數(shù)據(jù)庫在內(nèi)的公司達(dá)成合作。二十年前的PC或是十年前的移動互聯(lián)網(wǎng),兩代浪潮下,最賺錢的永遠(yuǎn)是不同信息載體的內(nèi)容平臺,“文字、圖片、視頻,甚至連聲音都有屬于自己的內(nèi)容平臺。”在宋亞宸看來,3D內(nèi)容平臺一直沒有出現(xiàn)的原因是創(chuàng)作門檻過高“還處于用毛筆寫字階段”,創(chuàng)作者的ROI算不過來。而現(xiàn)在,宋亞宸說,生產(chǎn)一個3D內(nèi)容的成本已經(jīng)無限接近0。“在抖音和快手爆發(fā)之前,一定出現(xiàn)了一個叫手機(jī)攝像頭的東西。”按照他們的比喻,正在自研的3D大模型Tripo就是手機(jī)攝像頭面向普通用戶,可以用文字和圖片直接生成3D模型。創(chuàng)業(yè)公司總被問及如何與大廠競爭,宋亞宸的回答是,“我會先問,第一,他們玩不玩游戲?真的想不想進(jìn)入虛擬世界?如果讓他們天天不上班,在家戴著XR眼鏡打游戲,他們愿不愿意?如果待一個月就會瘋,那對不起,他們就和我們有本質(zhì)的不同。”VAST的創(chuàng)業(yè)動力就源自宋亞宸對游戲和動漫的狂熱,“我屬于被電子海洛因投毒的90后。”在商湯時,宋亞宸看到一批“八大美院”畢業(yè)生富有天分,但他們的精力往往消耗在無止盡的建模中。他希望VAST能把創(chuàng)意型人才從“勞動密集型”產(chǎn)業(yè)中解放出來。AI生成3D領(lǐng)域的另一明星創(chuàng)業(yè)者是胡淵鳴。他畢業(yè)于清華大學(xué)姚班,博士畢業(yè)于MIT,是計(jì)算機(jī)圖形學(xué)知名學(xué)者,也是“太極”(TaiChi)編程語言作者。他最廣為人知的案例是曾用 99 行代碼打造了“冰雪奇緣”。去年11月,胡淵鳴官宣了致力于3D生成模型的新創(chuàng)業(yè)項(xiàng)目Meshy,如今已經(jīng)迭代至第4 代,同樣能夠?qū)崿F(xiàn)文生3D和圖生3D。不過胡淵鳴認(rèn)為,雖然AI生成3D大大降低了3D內(nèi)容創(chuàng)作的門檻、使得大眾也能進(jìn)行 3D 創(chuàng)作,但關(guān)于 3D 資產(chǎn)的使用場景還不夠成熟。事實(shí)上, MiniMax最早成立時,就同時做了語言、語音、視覺三個模型,希望智能體同時具有聲音、形象和文字的能力。但MiniMax很快就放棄了3D形象,因?yàn)閮?nèi)部認(rèn)為無法規(guī);。此前能夠承載3D的行業(yè)只有游戲和電影,而它們往往需要數(shù)年的研發(fā)周期。“同時,我意識到用深度學(xué)習(xí)來做3D這件事不對。在目前的載體手機(jī)上,如果一個3D人一直看著你,這本身就很奇怪。大部分情況下,交互其實(shí)不需要有一個真的形象。”MiniMax創(chuàng)始人閆俊杰在接受采訪時說。最好的結(jié)果當(dāng)然是,隨著Vision Pro、Quest 3等設(shè)備的普及,對于3D的需求會逐步增加,此時AI帶來的3D生產(chǎn)力提升,恰好能滿足隨之而來的需求。然而,即使是Meta和蘋果這樣的巨頭在該領(lǐng)域也遲遲無法破局,自2020年底以來,Meta負(fù)責(zé)VR領(lǐng)域的部門累計(jì)已虧損約500億美元。Vision Pro在推出的短暫熱潮后,出貨量同樣大幅不及預(yù)期;內(nèi)地如騰訊、字節(jié)也在去年2月宣布裁撤XR部門。3D的需求仍未被完全驗(yàn)證。一個最近的利好或許是,AI教母李飛飛官宣了新公司空間智能企業(yè)World Labs致力于用物理、邏輯和現(xiàn)實(shí)世界的豐富細(xì)節(jié)構(gòu)建出一個完整的世界。World Labs創(chuàng)始團(tuán)隊(duì)向《連線》雜志透露,他們第一階段會先構(gòu)建一個對三維性、物理性以及空間和時間概念有深入理解的模型,下一階段模型將支持AR。同時,World Labs的聯(lián)合創(chuàng)始人Ben Mildenhall也是DreamFusion的作者。而對焦慮的投資人們來說,當(dāng)AIGC里的“C”文字、圖片、視頻被掃蕩一空、甚至估值超過30億美金后,普遍估值尚可接受的AI生成3D公司可能是他們的最后一張船票。
圖片來源 |Unsplash
排版|姚楠