展會(huì)信息港展會(huì)大全

人形機(jī)器人,能橫掃工業(yè)場(chǎng)景嗎?
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-12-11 08:20:02   瀏覽:345次  

導(dǎo)讀:具身智能在2024年成為科技領(lǐng)域的新熱詞。人形機(jī)器人和具身智能公司,紛紛成立,一時(shí)風(fēng)頭無(wú)兩。不過(guò),目前的人形機(jī)器人和具身智能,往往更多停留在概念和demo之中,何時(shí)能真正落地,仍然未知。包括特斯拉的Optimus在內(nèi)的不少人形機(jī)器人企業(yè),都將人形機(jī)器人落地的第一場(chǎng)景,設(shè)在工業(yè)場(chǎng)景當(dāng)中。然而,工廠場(chǎng)景中,實(shí)際早已存在不少工業(yè)機(jī)器人。這些更傳統(tǒng)的工業(yè)機(jī)器人,未來(lái)會(huì)被 ......

具身智能在2024年成為科技領(lǐng)域的新熱詞。

人形機(jī)器人和具身智能公司,紛紛成立,一時(shí)風(fēng)頭無(wú)兩。

不過(guò),目前的人形機(jī)器人和具身智能,往往更多停留在概念和demo之中,何時(shí)能真正落地,仍然未知。包括特斯拉的Optimus在內(nèi)的不少人形機(jī)器人企業(yè),都將人形機(jī)器人落地的第一場(chǎng)景,設(shè)在工業(yè)場(chǎng)景當(dāng)中。

然而,工廠場(chǎng)景中,實(shí)際早已存在不少工業(yè)機(jī)器人。這些更傳統(tǒng)的工業(yè)機(jī)器人,未來(lái)會(huì)被人形機(jī)器人取代嗎?或者,它們是否將在哪些方面結(jié)合新的具身智能技術(shù),帶來(lái)新的生產(chǎn)效率的突破?

近期,極客公園接觸到了移動(dòng)機(jī)器人解決方案提供商優(yōu)艾智合。

優(yōu)艾智合在2017年就已經(jīng)成立,為工業(yè)企業(yè)提供物流機(jī)器人和巡檢機(jī)器人,尤其深耕半導(dǎo)體行業(yè),已經(jīng)形成上游晶圓生產(chǎn)、芯片封測(cè)、模組封裝到下游組裝的生產(chǎn)環(huán)節(jié)全覆蓋機(jī)器人解決方案,是半導(dǎo)體領(lǐng)域出貨量最大的移動(dòng)機(jī)器人企業(yè)。在2022年,優(yōu)艾智合的機(jī)器人已經(jīng)做到年出貨量?jī)汕в嗯_(tái)。

極客公園了解到,從2022年起,優(yōu)艾智合也在部署具身智能相關(guān)的技術(shù)能力,并在11月20日,與西安交通大學(xué)共同宣布成立具身智能機(jī)器人研究院。

在具身智能火起來(lái)之后,人們常常暢想,一個(gè)通用的人形機(jī)器人,可能會(huì)替代很多原有的專(zhuān)用機(jī)器人的未來(lái)。作為一個(gè)已經(jīng)有真實(shí)成熟的工業(yè)落地場(chǎng)景的公司,優(yōu)艾智合如何看待具身智能呢?

帶著這樣的疑問(wèn),極客公園采訪了優(yōu)艾智合CTO邊旭。采訪記錄有刪節(jié)。

具身智能可以讓機(jī)器人更聰明問(wèn):什么時(shí)候開(kāi)始思考落地具身智能?

邊旭:這應(yīng)該是從 22 年 10 月份到2023年我們開(kāi)始真正關(guān)注具身智能這個(gè)概念。

當(dāng)時(shí)谷歌和Everyday Robotics合作,第一次將大型語(yǔ)言模型集成到機(jī)器人中,我們當(dāng)時(shí)看了論文,下了一個(gè)判斷是,多模態(tài)大模型,最終只是一個(gè)接口,真正機(jī)器人要發(fā)揮作用,光靠大模型是遠(yuǎn)遠(yuǎn)不夠的,需要強(qiáng)化學(xué)習(xí)、模擬學(xué)習(xí)等很多技術(shù)產(chǎn)生突破。

這是我們思考的起點(diǎn),我們也開(kāi)始從2023年開(kāi)始投入了一些預(yù)研的資源。

問(wèn):目前的具身智能技術(shù)進(jìn)步,能夠解決哪些你們面臨的問(wèn)題?

邊旭:目前在進(jìn)展中的,最快能解決的問(wèn)題是視覺(jué)模型對(duì)環(huán)境的理解,能夠讓我們做出更安全、柔性的控制策略。

傳統(tǒng)的機(jī)器人對(duì)物理環(huán)境的重建,基本都是基于激光雷達(dá)的這種直接測(cè)量的方法進(jìn)行構(gòu)建。激光測(cè)距這項(xiàng)技術(shù)是有極限的。

比如我們的地面是平的,但是其實(shí)傳感器掃描出來(lái)的地面不是平的,是震蕩的。它掃出來(lái),可能是5cm厚的一個(gè)點(diǎn)云。其中上下2cm,都是它對(duì)地掃描的誤差。但是這仍然導(dǎo)致有些情況下,地上出現(xiàn)一條電線,這條電線本身的凸起并不超過(guò)2cm,這時(shí)候?qū)ξ⑿∥矬w的識(shí)別,會(huì)被淹沒(méi)在噪聲中。

而通過(guò)視覺(jué)識(shí)別,則機(jī)器人能夠直接認(rèn)識(shí)到前方出現(xiàn)細(xì)小物體,從而進(jìn)行避障。

我們運(yùn)送晶圓的機(jī)器人,如果被絆一跤,一點(diǎn)點(diǎn)損傷都會(huì)帶來(lái)很大的經(jīng)濟(jì)損失。在之前,我們只能通過(guò)工廠的安規(guī)管理,給機(jī)器人開(kāi)辟出專(zhuān)門(mén)的運(yùn)行區(qū)域來(lái)保證這樣的事情不會(huì)發(fā)生。

人形機(jī)器人,能橫掃工業(yè)場(chǎng)景嗎?

優(yōu)艾智合晶圓盒搬運(yùn)機(jī)器人 | 圖源:優(yōu)艾智合

但是真正解決這個(gè)問(wèn)題,要依靠具身智能中可自主學(xué)習(xí)的多模態(tài)感知也就是機(jī)器人能夠通過(guò)視覺(jué)識(shí)別,識(shí)別出物體,進(jìn)行更智能的規(guī)避。

在這點(diǎn)上,我們的研發(fā)已經(jīng)有了階段性的成果,在我們的樣機(jī)上,demo上效果已經(jīng)能做到比較好了。

問(wèn):具身智能的下一步技術(shù)進(jìn)步中,作為一個(gè)有落地場(chǎng)景的工業(yè)機(jī)器人公司,你們更關(guān)注于哪方面的技術(shù)進(jìn)步?

邊旭:我們也在關(guān)注端到端的運(yùn)動(dòng)控制,這件事本身是很難的,目前我們也只是在做前期的研究工作。

端到端的自動(dòng)控制,類(lèi)似于特斯拉在做的端到端的自動(dòng)駕駛,也就是整個(gè)運(yùn)動(dòng)控制的指令都是模型生成的。而我們提供工業(yè)機(jī)器人,要到運(yùn)動(dòng)控制的指令都由機(jī)器人生成,實(shí)際上需要更精準(zhǔn),犯錯(cuò)率更低。

另外,達(dá)成端到端的運(yùn)動(dòng)控制,也依賴(lài)為我們提供機(jī)械臂本體的上下游生態(tài)伙伴,做相應(yīng)的底層調(diào)整,共同進(jìn)步。

問(wèn):端到端的運(yùn)動(dòng)控制可以幫你們解決什么樣的問(wèn)題?

邊旭:比如我們?yōu)榘雽?dǎo)體行業(yè)提供工業(yè)物流機(jī)器人,機(jī)器人的形態(tài)是復(fù)合機(jī)器人,這樣的機(jī)器人,每臺(tái)對(duì)接一個(gè)工位,正常都需要經(jīng)過(guò)一些參數(shù)化的配置和調(diào)試,這是行業(yè)通用的做法。

但實(shí)際上這個(gè)是非常耗時(shí)的。你要做一些標(biāo)定,做一些過(guò)渡點(diǎn)的錄制,這樣的配置和調(diào)試過(guò)程其實(shí)是非常不柔性的,也無(wú)法被批量復(fù)制。

我們之前做出海,已經(jīng)賣(mài)出了不少機(jī)器人解決方案,其實(shí)我們?cè)谌澜缍加泻艽蟮男枨螅窃诮袊?guó)的日本和東南亞,開(kāi)展地更順利,原因之一就是出海的話,我們也需要很大的部署成本。

通過(guò)我們前面說(shuō)的目標(biāo)識(shí)別,融合視覺(jué)和3D的點(diǎn)云數(shù)據(jù),保證目標(biāo)識(shí)別的魯棒性,再根據(jù)目標(biāo)識(shí)別,做到通過(guò)少量學(xué)習(xí)和零次學(xué)習(xí),可以讓機(jī)器人完成手眼協(xié)同,自適應(yīng)部署。

這樣基于目標(biāo)的端到端的運(yùn)動(dòng)控制模型,和通用代碼大模型去自動(dòng)化腳生成檢測(cè)、生成部署腳本能夠幫助我們大幅降低部署成本。

企業(yè)客戶(hù)希望有更聰明的機(jī)器人,但最好沒(méi)有成本增加問(wèn):在之前已經(jīng)落地的場(chǎng)景中,其實(shí)通過(guò)安規(guī)管理等方式,可以部分解決機(jī)器人不夠智能的問(wèn)題,那么使用具身智能會(huì)不會(huì)使成本提升很高?

邊旭:在人形機(jī)器人上要做具身智能,可能需要非常強(qiáng)大的GPU,上萬(wàn)塊的成本,這確實(shí)在工業(yè)機(jī)器人里是不可接受的。

我們考慮要使用低算力的平臺(tái),實(shí)現(xiàn)高具身智能的效果。我們主要是使用NPU,6-7 TOPS的算力,來(lái)跑一些視覺(jué)模型。

即使是我們后面說(shuō)的這種,運(yùn)動(dòng)控制方向的具身智能的部署,在我看來(lái),未來(lái)也是成本可控的。因?yàn)槲覀儥C(jī)器人硬件中,本身已經(jīng)有了視覺(jué)和雷達(dá)的部分,這部分的成本是本來(lái)就有的。只是需要再對(duì)數(shù)據(jù)進(jìn)行算法層面的訓(xùn)練。

問(wèn):你覺(jué)得企業(yè)實(shí)際上能接受多少成本的上升?

邊旭:我覺(jué)得對(duì)企業(yè)來(lái)說(shuō),其實(shí)最好是沒(méi)有成本增加,甚至有運(yùn)維成本的下降。

比如我們前面說(shuō)的,通過(guò)管理的方式可以解決的問(wèn)題,實(shí)際上本身還是依賴(lài)于人工,而人是工業(yè)生產(chǎn)中最不可控的變量,根本上如果機(jī)器人能智能化地解決這個(gè)問(wèn)題,整體運(yùn)維成本是下降的。

對(duì)于我們自身而言,也會(huì)降低很多和企業(yè)之間的溝通成本。

問(wèn):除了成本之外,企業(yè)還會(huì)比較關(guān)注哪些問(wèn)題?

邊旭:企業(yè)也會(huì)比較在意數(shù)據(jù)鏈路的絕對(duì)安全。

很多客戶(hù)的要求是數(shù)據(jù)不出園區(qū),那可能一些人形機(jī)器人使用公有云上的模型的這種操作模式就不適合我們。

人形機(jī)器人,能橫掃工業(yè)場(chǎng)景嗎?

優(yōu)艾智合智能巡檢操作機(jī)器人| 圖源:優(yōu)艾智合

此外,前面說(shuō)過(guò),工業(yè)場(chǎng)景對(duì)AI的犯錯(cuò)容忍度很低?蛻(hù)對(duì)我們的要求就是零異常。一般的工業(yè)公司對(duì)推AI都比較謹(jǐn)慎。

所以我們認(rèn)為純靠AI算法解決所有問(wèn)題的思路本身是錯(cuò)的。越智能就越容易不可控。泛化性的智能控制,還是需要結(jié)合一些條件策略,才能更好地讓產(chǎn)品閉環(huán)。

問(wèn):在工業(yè)領(lǐng)域,具身智能還有什么獨(dú)特的特點(diǎn)?

邊旭:我們理解具身智能是兩部分,第一個(gè)是單體智能,也就是一腦多態(tài)的這種智能控制系統(tǒng),另一方面是,群體智能。

在這套解決方案里,機(jī)器人只是一環(huán),機(jī)器人的智能化水平可以無(wú)限接近于人。但是工廠中要實(shí)現(xiàn)全廠的生產(chǎn),它還需要其他的,比如說(shuō)電梯、產(chǎn)線,和其他設(shè)備類(lèi)的東西,都會(huì)參與到整個(gè)的過(guò)程中。我們現(xiàn)在傳感器只是布置在機(jī)器人上,未來(lái)可能傳感器是部署在全場(chǎng)的解決方案里面的。

這個(gè)全場(chǎng)的解決方案,里面涉及到的就是群體智能。這里面怎么去融合感知,來(lái)保證機(jī)器人的安全和效率,我覺(jué)得想象的空間比機(jī)器人本體更大。

人形機(jī)器人,能夠橫掃工業(yè)場(chǎng)景嗎?問(wèn):過(guò)去一兩年,有很多具身智能和人形機(jī)器人的公司成立。很多公司的愿景都是最后走向一個(gè)通用的人形機(jī)器人,它泛化性非常強(qiáng),什么工廠都能進(jìn),什么工廠內(nèi)的任務(wù)都能做。你怎么看待未來(lái)的通用人形機(jī)器人,它會(huì)成為傳統(tǒng)工業(yè)機(jī)器人的終結(jié)者嗎?

邊旭:其實(shí)為什么工廠在很多場(chǎng)景下已經(jīng)開(kāi)始使用機(jī)器人了?就是因?yàn)槠鋵?shí)人類(lèi)在很多情況下已經(jīng)不夠適應(yīng)工業(yè)所需的一些情況了。

比如在工業(yè)巡檢領(lǐng)域,人只能看到可見(jiàn)光,看不到紅外光,也看不到聲波。我們只能依靠目視距離操作。

因此我們?cè)谘矙z中,提出了超視距的多模態(tài)感知,首先傳感器不局限于機(jī)器人在哪里,都能獲得數(shù)據(jù),其次能夠通過(guò)AI的分析處理,獲得隱藏在聲紋等數(shù)據(jù)中的一些異常,得到自適應(yīng)感知,這其實(shí)都是對(duì)人類(lèi)能力的超越。

對(duì)于我們工業(yè)從業(yè)者來(lái)說(shuō),我們看問(wèn)題比較實(shí)際。我認(rèn)為我們的積累其實(shí)是一種壁壘。

一個(gè)機(jī)器人,你沒(méi)有做過(guò)這個(gè)場(chǎng)景,怎么能講它有泛化的能力,去解決這個(gè)場(chǎng)景的問(wèn)題?

對(duì)于工業(yè)場(chǎng)景而言,首先,工業(yè)場(chǎng)景比較閉塞,很難通過(guò)互聯(lián)網(wǎng)去學(xué)習(xí)到相關(guān)的知識(shí),有很強(qiáng)的行業(yè)屬性,機(jī)器人很難通過(guò)通用的數(shù)據(jù)進(jìn)行泛化地學(xué)習(xí)。

其次,工業(yè)機(jī)器人的產(chǎn)品定義,本身就是工業(yè)機(jī)器人企業(yè)和工業(yè)企業(yè)一起推動(dòng)的?蛻(hù)需要機(jī)器人,但又不完全清晰的知道需求的細(xì)節(jié)。很多產(chǎn)品定義都是我們?cè)谶@個(gè)場(chǎng)景中積累總結(jié),和客戶(hù)共創(chuàng)獲得的。

問(wèn):傳統(tǒng)工業(yè)場(chǎng)景下已經(jīng)落地的機(jī)器人企業(yè)的主要優(yōu)勢(shì)在哪里?

邊旭:主要還是在行業(yè)深耕后,獲得的壁壘。

比如我們?cè)谧罨镜腟LAM能力上,我們有很多corner case的應(yīng)對(duì)經(jīng)驗(yàn)。比如環(huán)境對(duì)機(jī)器人定位的多種非線性擾動(dòng),對(duì)于機(jī)器人定位導(dǎo)航的干擾是非常大的,并且是很難量化。這對(duì)于你的定位導(dǎo)航的魯棒性,和智能化要求很高。

人形機(jī)器人本身,如果能找到一個(gè)合適落地的場(chǎng)景,再有很強(qiáng)的技術(shù)基礎(chǔ),或許未來(lái)在工業(yè)場(chǎng)景中也會(huì)有一席之地。

但我認(rèn)為在一個(gè)我們已經(jīng)深耕過(guò)的行業(yè)里,我們?cè)偌尤刖呱碇悄艿募夹g(shù),我們做這件事的路徑可以是最短的。

問(wèn):工業(yè)場(chǎng)景,最終的形態(tài)會(huì)是人形機(jī)器人嗎?

邊旭:一個(gè)通用人形機(jī)器人,來(lái)適配所有的場(chǎng)景是很難的,你很難倒逼所有行業(yè)客戶(hù)改去適配你的設(shè)備。

可能只有純?nèi)斯さ膱?chǎng)景,用人形做,客戶(hù)改造成本就低一點(diǎn)。但也可能在那之前,全場(chǎng)景的移動(dòng)機(jī)器人的方案已經(jīng)覆蓋了這個(gè)行業(yè)了。

我覺(jué)得工業(yè),相對(duì)于對(duì)于服務(wù)場(chǎng)景等,最大的區(qū)別就是成本和效率。

越通用,代表著對(duì)于某個(gè)細(xì)分行業(yè)來(lái)講,應(yīng)用成本越高,它會(huì)有很多功能的冗余。

考慮到效率因素,其實(shí)不應(yīng)該所有行業(yè)都用一樣機(jī)器人。

人形機(jī)器人,能橫掃工業(yè)場(chǎng)景嗎?

特斯拉人形機(jī)器人Optimus | 圖片來(lái)源:視覺(jué)中國(guó)

而為不同行業(yè)打造的話,模型也可以是更加針對(duì)這個(gè)場(chǎng)景的,可以就是以更小的數(shù)據(jù)去訓(xùn)練,然后運(yùn)用的成本也更低,然后更針對(duì)這個(gè)場(chǎng)景,

問(wèn):對(duì)于只做大腦的具身智能企業(yè)而言,如果不是一個(gè)通用的人形機(jī)器人來(lái)承載其大腦的部分,而是有多種多樣的終端形態(tài),會(huì)對(duì)執(zhí)行產(chǎn)生一些困難嗎?

邊旭:會(huì)有一些困難。

不同的上集成其實(shí)是一個(gè)新的模型。雖然從目標(biāo)識(shí)別,視覺(jué)的角度來(lái)講差別不大,但在執(zhí)行和安全角度講,不同的本體構(gòu)型是有差異的。

在工業(yè)里邊,其實(shí)在機(jī)電系統(tǒng)和機(jī)構(gòu)學(xué)上不存在通用的。就是每一種構(gòu)型其實(shí)都要滿(mǎn)足它的一個(gè)特殊工藝的一個(gè)設(shè)計(jì)生產(chǎn)要求。

問(wèn):怎么看未來(lái)的人形機(jī)器人?

邊旭:我覺(jué)得,現(xiàn)在的人形機(jī)器人,不論從技術(shù)成熟度、量產(chǎn)能力,還是商業(yè)模式的成熟度上,其實(shí)是和幾年前工業(yè)移動(dòng)機(jī)器人剛興起的時(shí)候很像。

機(jī)器人本體是一部分, 但更重要的是智能系統(tǒng)端的進(jìn)步。

在移動(dòng)機(jī)器人行業(yè),目前其實(shí)有很多做移動(dòng)機(jī)器人本體的廠家,可以把產(chǎn)品做得很標(biāo)準(zhǔn),成本很低,穩(wěn)定性很強(qiáng)。而我們做解決方案的企業(yè)的優(yōu)勢(shì),則在于需要長(zhǎng)時(shí)間積累的智能系統(tǒng)。

我想未來(lái),可能也會(huì)有很多做這種人形機(jī)型本體的廠家,將本體做的很好。而像我們這樣的公司,可以在人形機(jī)器人上,構(gòu)建我們的工業(yè)應(yīng)用。

我們目前的技術(shù)布局,已經(jīng)在具身控制器這塊布局了未來(lái)兼容足式機(jī)器人的架構(gòu),我們目前看不到人形機(jī)器人在工業(yè)場(chǎng)景有太好的應(yīng)用,但不代表未來(lái)沒(méi)有,我們會(huì)持續(xù)關(guān)注提前布局。

比起機(jī)器人的形態(tài),我們更關(guān)注具身智能技術(shù)在工業(yè)領(lǐng)域規(guī);涞氐穆窂脚c節(jié)點(diǎn)。我們認(rèn)為“一腦多態(tài)”是具身智能落地工業(yè)場(chǎng)景的最佳形態(tài),再通過(guò)集群化的協(xié)同交互,可以實(shí)現(xiàn)工業(yè)企業(yè)生產(chǎn)效率和效率的提升。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港