本文來(lái)源:時(shí)代周報(bào) 作者:郭美婷
人形機(jī)器人火了。
今年人工智能大會(huì),以特斯拉的二代人形機(jī)器人Optimus為代表,宇樹(shù)科技、傅利葉、達(dá)闥、樂(lè)聚、開(kāi)普勒、天鏈等十?dāng)?shù)家人形機(jī)器人廠商均展出了自家的“得意之作”,狠狠秀了一輪“肌肉”。
雖然有機(jī)構(gòu)預(yù)測(cè),今年會(huì)成為人形機(jī)器人的量產(chǎn)元年。但達(dá)闥機(jī)器人(下稱(chēng)“達(dá)闥”)副總裁、廣州公司總經(jīng)理王恩璽在接受時(shí)代周報(bào)記者專(zhuān)訪(fǎng)時(shí)卻表示,目前“量產(chǎn)”只是一個(gè)噱頭。人形機(jī)器人僅僅被造出來(lái)了,但還沒(méi)到能解具體決問(wèn)題的階段。
而且他表示,在商業(yè)化落地過(guò)程中,人形機(jī)器人的價(jià)格也是廠商們需要考慮的一大問(wèn)題。
達(dá)闥是人形機(jī)器人行業(yè)的頭部公司之一,在2019年B輪融資后躋身為獨(dú)角獸企業(yè)。在WAIC 2024會(huì)場(chǎng),時(shí)代周報(bào)記者對(duì)達(dá)闥副總裁王恩璽進(jìn)行了專(zhuān)訪(fǎng),對(duì)人形機(jī)器人的商業(yè)化進(jìn)展和落地難題等相關(guān)問(wèn)題進(jìn)行探討。
王恩璽。圖源:受訪(fǎng)者供圖
為什么非“人形”不可?
時(shí)代周報(bào):機(jī)器人并不是一個(gè)新鮮的概念。在很久之前,工廠中就利用機(jī)械臂完成重復(fù)單一的任務(wù)。為何我們還要發(fā)展人形機(jī)器人?
王恩璽:
機(jī)器人的概念確實(shí)存在很長(zhǎng)時(shí)間了。從整個(gè)機(jī)器人的分類(lèi)來(lái)看,大概包括工業(yè)機(jī)器人、服務(wù)機(jī)器人和特種機(jī)器人。某些機(jī)器人是為特定場(chǎng)景而服務(wù)的,如工業(yè)機(jī)械臂、爬蟲(chóng)機(jī)器人、清潔機(jī)器人等。
但是,人類(lèi)創(chuàng)造機(jī)器人的最終目標(biāo),是為了將人類(lèi)從骯臟、復(fù)雜、繁瑣的功能中解脫出來(lái),最直接的方法就是能完全代替這個(gè)人,首先外形設(shè)計(jì)要像人。在人類(lèi)的生產(chǎn)生活中,各種工具的發(fā)明、流程的制定都是以人為核心的,當(dāng)你使用一個(gè)人形機(jī)器人去替代人的時(shí)候,它對(duì)周?chē)h(huán)境的影響是最小的,也無(wú)需對(duì)現(xiàn)有的生產(chǎn)場(chǎng)景和工具做出較大變動(dòng)。
另一方面,從新物種的角度來(lái)看,人類(lèi)對(duì)特異的物種有天生的排斥感。那么當(dāng)人形機(jī)器人未來(lái)應(yīng)用于居家、服務(wù)、養(yǎng)老行業(yè),從而進(jìn)入到千家萬(wàn)戶(hù),人類(lèi)一定更能接受和自己外形相似的機(jī)器人一起生活。如果機(jī)器人長(zhǎng)著三條手臂,即使技術(shù)上不存在問(wèn)題,工作起來(lái)也更高效,但人類(lèi)可能還是很難接受該物種。
時(shí)代周報(bào):目前,有哪些場(chǎng)景比較適合人形機(jī)器人應(yīng)用?
王恩璽:
對(duì)此問(wèn)題,業(yè)內(nèi)如今其實(shí)有一定共識(shí)。2023年11月,工業(yè)和信息化部印發(fā)《人形機(jī)器人創(chuàng)新發(fā)展指導(dǎo)意見(jiàn)》,里面提到了兩類(lèi)場(chǎng)景。一類(lèi)是面向民爆、救援等等特殊環(huán)境,強(qiáng)化人形機(jī)器人本體安全防護(hù)能力、復(fù)雜任務(wù)智慧生成與高精度操作能力,降低作業(yè)人員危險(xiǎn)性。
另一類(lèi)場(chǎng)景是聚焦3C、汽車(chē)等制造業(yè)重點(diǎn)領(lǐng)域,打造人形機(jī)器人示范產(chǎn)線(xiàn)和工廠。這也是為何如今汽車(chē)制造變成了人形機(jī)器人行業(yè)較為重要的發(fā)力點(diǎn),汽車(chē)的整個(gè)生產(chǎn)制造流程較為清晰,也相對(duì)容易定義出哪些可替代人類(lèi)工作的場(chǎng)景。當(dāng)企業(yè)把汽車(chē)制造“玩”明白后,下一步就可以做3C了。
例如去年比亞迪就投資人形機(jī)器人公司智元機(jī)器人,上汽在今年同樣投資了該公司;去年小米、優(yōu)必選等成立北京人形機(jī)器人創(chuàng)新中心;我們達(dá)闥也正在和廣汽談合作。
而當(dāng)人形機(jī)器人ToB場(chǎng)景打磨成熟后,就能夠逐步進(jìn)入到家庭,服務(wù)居家養(yǎng)老,技術(shù)是一步步演進(jìn)的。
圖源:時(shí)代周報(bào)記者攝
大模型如何上機(jī)?
時(shí)代周報(bào):這屆人工智能大會(huì),“大模型+機(jī)器人”對(duì)機(jī)器人泛化能力的提升是大家較為關(guān)注的熱點(diǎn)。達(dá)闥的人形機(jī)器人上是否也搭載了大模型?是如何部署的?
王恩璽:
達(dá)闥成立之初就是從云端大腦開(kāi)發(fā)起的,我們認(rèn)為機(jī)器人的算力、智力一定是運(yùn)行在云端,配合5G低延遲的網(wǎng)絡(luò)。大模型出現(xiàn)之前,2017年我們利用多模態(tài)算法,訓(xùn)練人形機(jī)器人的視覺(jué)、語(yǔ)音、動(dòng)作和運(yùn)動(dòng)。大模型出現(xiàn)后,我們就基于原有算法技術(shù)的積累做了針對(duì)性的模型微調(diào)和優(yōu)化,并通過(guò)我們自己的機(jī)器人收集的各類(lèi)型數(shù)據(jù)做了大量訓(xùn)練,在2023年發(fā)布了RobotGPT。
我認(rèn)為人形機(jī)器人想在復(fù)雜的場(chǎng)景完成任務(wù)的話(huà),光靠端側(cè)的算力是不夠的。雖然如今部分設(shè)備如手機(jī)、PC等,能夠植入經(jīng)過(guò)充分訓(xùn)練后的、參數(shù)較小的模型,并在端側(cè)做推理。但是當(dāng)面臨復(fù)雜的場(chǎng)景或如居家服務(wù)中的開(kāi)放性場(chǎng)景,人形機(jī)器人需要很泛化的能力,光靠端側(cè)大模型的能力是不足的,需要云端大腦來(lái)支撐訓(xùn)練和推理。
時(shí)代周報(bào):但是,當(dāng)人形機(jī)器人居家使用時(shí)候,將家庭私人的數(shù)據(jù)上傳到云端,是否會(huì)存在隱私泄露的問(wèn)題?
王恩璽:
數(shù)據(jù)安全是一個(gè)永恒的話(huà)題。保證數(shù)據(jù)安全的方法通常有兩種,一是通過(guò)各種先進(jìn)技術(shù)保證數(shù)據(jù)不被竊取和泄露。當(dāng)然,在這方面有時(shí)存在“道高一尺魔高一丈”的情況,沒(méi)有什么技術(shù)是永遠(yuǎn)奏效的。所以我認(rèn)為數(shù)據(jù)安全不完全是一個(gè)技術(shù)問(wèn)題,而是一個(gè)管理問(wèn)題。
二是建立保障或信任機(jī)制。我們的策略是跟運(yùn)營(yíng)商合作,將云端大腦部署在運(yùn)營(yíng)商,如中國(guó)移動(dòng)的云平臺(tái)上,通過(guò)國(guó)企背書(shū)來(lái)確保數(shù)據(jù)隱私安全。
未來(lái),我們?cè)O(shè)計(jì)的商業(yè)模式是通過(guò)運(yùn)營(yíng)商的渠道向每個(gè)家庭租賃人形機(jī)器人,就好比每家使用機(jī)頂盒上網(wǎng),一千兆寬帶每月200塊錢(qián),未來(lái)可能租賃一臺(tái)人形機(jī)器人每月花1500-3000元。機(jī)器人收集的數(shù)據(jù)將保存在運(yùn)營(yíng)商的云平臺(tái)上,就如同手機(jī)電話(huà)數(shù)據(jù)存儲(chǔ)在運(yùn)營(yíng)商的數(shù)據(jù)庫(kù)中。
“量產(chǎn)”還是一個(gè)噱頭
時(shí)代周報(bào):有機(jī)構(gòu)預(yù)測(cè),今年會(huì)成為人形機(jī)器人的量產(chǎn)元年,你同意這種看法嗎?
王恩璽:
對(duì)于“量產(chǎn)”這個(gè)詞我是有疑義的。量產(chǎn)的前提是,一個(gè)產(chǎn)品有非常具體的使用場(chǎng)景,能夠解決該場(chǎng)景下的問(wèn)題,而且有非常明確的產(chǎn)品功能說(shuō)明書(shū),這和我們購(gòu)買(mǎi)任何一件消費(fèi)類(lèi)產(chǎn)品是一致的。這個(gè)時(shí)候的量產(chǎn)才是有意義的。
那么現(xiàn)在人形機(jī)器人所謂的“量產(chǎn)”,我認(rèn)為只是聲明人形機(jī)器人被造出來(lái)了。人形機(jī)器人還沒(méi)有到具體能解決什么問(wèn)題的階段,例如在ToB場(chǎng)景下,是否能在生產(chǎn)線(xiàn)幫忙擰螺絲、打膠、搬東西等,都沒(méi)有明確。所以我認(rèn)為現(xiàn)在談“量產(chǎn)”,還只是一個(gè)噱頭。
包括從這次人工智能大會(huì)會(huì)場(chǎng),你會(huì)看到大家比拼的不是人形機(jī)器人在哪個(gè)場(chǎng)景做了什么工作,從端到端實(shí)現(xiàn)場(chǎng)景閉環(huán)等,而是展示機(jī)器人能走路,能揮手等功能,這是人形機(jī)器人的基本功能要求。從原型機(jī)的推出,到具體能解決什么場(chǎng)景問(wèn)題,是目前整個(gè)業(yè)界都在努力攻破的。
時(shí)代周報(bào):現(xiàn)在人形機(jī)器人的發(fā)展還存在哪些技術(shù)難點(diǎn)?
王恩璽:
硬件上,人形機(jī)器人關(guān)節(jié)的發(fā)展,架構(gòu)設(shè)計(jì),是否更加靈活,能夠?qū)崿F(xiàn)抓娶翻轉(zhuǎn)等類(lèi)人的更精準(zhǔn)的操作等,這是在運(yùn)動(dòng)控制領(lǐng)域需要持續(xù)迭代的。
另外一個(gè)難點(diǎn)體現(xiàn)在利用大模型技術(shù)對(duì)人形機(jī)器人做各種場(chǎng)景的訓(xùn)練。自大模型技術(shù)出現(xiàn)后,人形機(jī)器人在某些場(chǎng)景下能夠做出的動(dòng)作已經(jīng)超出了原有的訓(xùn)練模式。例如通過(guò)視頻學(xué)習(xí)、人工示教、強(qiáng)化學(xué)習(xí)等,能夠讓機(jī)器人快速掌握在該場(chǎng)景下應(yīng)該做出的動(dòng)作,并且泛化到其他場(chǎng)景,這就是大模型所具備的優(yōu)勢(shì),大模型的發(fā)展與人形機(jī)器人息息相關(guān)。
其實(shí),我更傾向于認(rèn)為人形機(jī)器人的發(fā)展沒(méi)有卡脖子的技術(shù),沒(méi)有不可攻克的難題,但它需要時(shí)間迭代,變得更加成熟、更加精細(xì)、也更加精準(zhǔn)。
時(shí)代周報(bào):價(jià)格高昂也是人形機(jī)器人實(shí)現(xiàn)商業(yè)化落地的阻礙之一。能否舉例說(shuō)明,怎樣定價(jià)一臺(tái)人形機(jī)器人才能使其更具購(gòu)買(mǎi)力?
王恩璽:
我跟一些汽車(chē)制造廠商交流過(guò),如果人形機(jī)器人真的能替代人工,他們希望產(chǎn)品的定價(jià)最高限制不超過(guò)20萬(wàn)。因?yàn)楝F(xiàn)在生產(chǎn)線(xiàn)上的工人的工資大概在8000-1萬(wàn)左右,一年開(kāi)支大概是10-15萬(wàn)塊錢(qián),人形機(jī)器人不知疲憊,可以24小時(shí)持續(xù)干活,所以?xún)r(jià)格可以稍高,但超過(guò)20萬(wàn)也不劃算了。
但如今人形機(jī)器人的造價(jià)基本上是百萬(wàn)級(jí)別的。這是因?yàn)槟壳叭诵螜C(jī)器人的造價(jià)還沒(méi)有考慮到未來(lái)銷(xiāo)量。公司們剛剛把人形機(jī)器人造出來(lái),更多考慮其功能的實(shí)現(xiàn),還沒(méi)開(kāi)始重視成本的優(yōu)化。如果對(duì)銷(xiāo)量沒(méi)有合理預(yù)期的話(huà),就無(wú)法從供應(yīng)鏈的維度降低成本。
時(shí)代周報(bào):從商業(yè)邏輯來(lái)看,你認(rèn)為人形機(jī)器人企業(yè)如何能加速商業(yè)化落地的進(jìn)程?
王恩璽:
現(xiàn)在人形機(jī)器人需要更多場(chǎng)景開(kāi)放去推進(jìn)其發(fā)展。市場(chǎng)上對(duì)人形機(jī)器人的使用是持開(kāi)放態(tài)度的,無(wú)論是老齡化社會(huì)的到來(lái),還是制造業(yè)降低成本的需求催化下,社會(huì)對(duì)于人形機(jī)器人的期望值很高。
對(duì)于人形機(jī)器人公司而言,目前最大的成本是時(shí)間成本。因?yàn)榇蜷_(kāi)和解決一個(gè)具體場(chǎng)景的問(wèn)題,需要研發(fā)、測(cè)試,迭代等反復(fù)過(guò)程,如果企業(yè)無(wú)法在短時(shí)間內(nèi)找到落地場(chǎng)景,可能會(huì)導(dǎo)致其生存都難以為繼。
現(xiàn)在整個(gè)產(chǎn)業(yè)界也在爭(zhēng)先恐后、優(yōu)勝劣汰的賽馬進(jìn)程中。我特別認(rèn)同馬斯克的一句話(huà):創(chuàng)新的速度比創(chuàng)新更重要。