具身智能的三維生存挑戰(zhàn)
作者/IT時(shí)報(bào)記者沈毅斌
編輯/郝俊慧孫妍
Sora正式上線后,另一條火熱的科技賽道具身智能,近期也迎來(lái)商業(yè)化“前夜”。
12月16日,“華為天才少年”“稚暉君”(彭志輝)創(chuàng)辦的智元機(jī)器人宣布,開(kāi)啟通用機(jī)器人商用量產(chǎn),此時(shí)距離智元機(jī)器人發(fā)布“遠(yuǎn)征”與“靈犀”兩大家族五款商用人形機(jī)器人新品,僅過(guò)了四個(gè)月。
幾乎同時(shí),比亞迪官微發(fā)布了一則具身智能方向的招聘信息,面向2025屆全球高校碩士、博士畢業(yè)生招聘具身智能研究團(tuán)隊(duì),推進(jìn)具身智能在工業(yè)領(lǐng)域的落地應(yīng)用。小米集團(tuán)核心創(chuàng)始團(tuán)隊(duì)創(chuàng)辦的大模型機(jī)器人公司小雨智造,近日也完成新一輪融資,用于加大研發(fā)力度,推動(dòng)具身智能產(chǎn)品創(chuàng)新。
再往回看,今年各類展會(huì)都是具身智能“秀肌肉”的舞臺(tái),人們?cè)谝环藱C(jī)共存的場(chǎng)景中暢想未來(lái)。然而,回到現(xiàn)實(shí),商業(yè)化來(lái)臨之際,相較人機(jī)交互的LLM大模型,具身智能要面對(duì)更多來(lái)自三維世界的挑戰(zhàn)。
數(shù)據(jù)
從“好看的皮囊”到“有用的載體”
展會(huì)上,人形機(jī)器人現(xiàn)場(chǎng)跳舞、交互、分揀物品、擦桌子等操作,已經(jīng)成為吸引觀眾的“秘密武器”。如果將大模型比作“有趣的靈魂”,具身智能則是“好看的皮囊”。但離開(kāi)展會(huì),真正實(shí)現(xiàn)具身智能落地的場(chǎng)景并不多見(jiàn),如何讓具身智能實(shí)現(xiàn)從“好看的皮囊”向“有用的載體”跨越,數(shù)據(jù)是核心。
“我們發(fā)現(xiàn)具身智能和多模態(tài)大模型發(fā)展最不一樣的點(diǎn),就是機(jī)器人數(shù)據(jù)的稀缺性!敝窃聞(chuàng)具身業(yè)務(wù)部總裁姚卯青在浦江AI學(xué)術(shù)年會(huì)具身智能專題論壇上表示,相較于大模型可以免費(fèi)獲取互聯(lián)網(wǎng)數(shù)據(jù),機(jī)器人能用的高質(zhì)量、帶標(biāo)簽數(shù)據(jù),一個(gè)數(shù)據(jù)集中最多只有幾百萬(wàn)條,并且這些數(shù)據(jù)集屬于多種格式的混合體,質(zhì)量參差不齊,“所以大家最?吹降难菔局挥腥诵螜C(jī)器人的桌面操作,比如把水果、積木搬來(lái)搬去”。
智元機(jī)器人
“可用的物理世界數(shù)據(jù)集還遠(yuǎn)遠(yuǎn)不夠,具身智能還在非常初級(jí)的階段!鄙虾8道~副總裁周斌補(bǔ)充道,人工遙操是目前主流的機(jī)器人數(shù)據(jù)采集方法,其核心目標(biāo)是使機(jī)器人本體操作盡可能接近人類的行為模式。但這一方法需要花費(fèi)大量人力和時(shí)間。