OpenAI入場,人形機(jī)器人的時代要到了?
據(jù)美國科技媒體The Information報道,OpenAI正在考慮重組已解散四年的機(jī)器人團(tuán)隊,將親自下場研發(fā)人形機(jī)器人。
在此之前,OpenAI已投資了igure AI、1X、Physical Intelligence三家機(jī)器人公司,副總裁Peter Welinder還曾表示,通過與Figure等公司合作,OpenAI希望探索在大型多模態(tài)AI模型支持下,人形機(jī)器人的智能化水平能夠達(dá)到何種程度。
按照Peter Welinder原本的說法,當(dāng)時OpenAI似乎沒打算親自研發(fā)機(jī)器人,目標(biāo)是集中自己的優(yōu)勢,打造適合機(jī)器人的“大腦”即巨身智能大模型。然而現(xiàn)在OpenAI卻要重組機(jī)器人團(tuán)隊,研發(fā)人形機(jī)器人,態(tài)度的轉(zhuǎn)變令小雷好奇,OpenAI為何決定親自下場?
機(jī)器人,才是AI的最終形態(tài)?
OpenAI帶領(lǐng)AI技術(shù)進(jìn)入新時代后,不少網(wǎng)友吐槽,我們對AI的要求是希望它們完成家務(wù)勞動,從而解放我們,讓我們擁有更多時間去創(chuàng)作藝術(shù),事實卻恰恰相反,AI學(xué)會了繪畫、創(chuàng)作音樂、撰寫小說,人類則依然被困于家務(wù)勞動。
在辦公領(lǐng)域,AI已經(jīng)發(fā)揮出了不小的作用和價值,如職場人士可以利用AI總結(jié)會議重點、媒體工作者可以使用AI創(chuàng)作圖片、程序員可以使用AI編寫代碼,金融、保險、律師等行業(yè)可以通過AI快速查詢信息、解答問題、給出建議,但在家務(wù)領(lǐng)域,AI技術(shù)卻有力不逮。
(圖源:AI生成)
盡管在AI席卷全球后,家電企業(yè)也積極擁抱AI,推出了一系列支持AI功能的冰箱、洗衣機(jī)、炒菜機(jī)等產(chǎn)品,但大多數(shù)工序依然需要用戶完成。AI家電可不會主動把我們購買的東西分類存放到冰箱,更不會主動收拾我們換洗的衣服。
現(xiàn)階段C端用戶場景AI功能受限,主要原因便在于沒有一個合適的載體,方便AI與現(xiàn)實世界進(jìn)行接觸。機(jī)器人,尤其是人形機(jī)器人,無疑是AI技術(shù)未來的最好載體,并因此衍生出了具身智能概念。具身智能機(jī)器人可通過機(jī)械結(jié)構(gòu)和傳感器去感知真實世界,并根據(jù)反饋進(jìn)行判斷和決策,從而幫助AI大模型深入理解世界。
最近幾年,各大企業(yè)推出了不少機(jī)器人設(shè)備,但大多數(shù)機(jī)器人設(shè)備都存在一個問題,即功能過于簡單,無法完成復(fù)雜工作。例如小米仿生機(jī)器狗鐵蛋,主打親情陪伴,通過AI語音交互也可以控制家里的智能家居,卻無法幫助我們處理家務(wù)。
自然界的諸多動物中,靈長類動物之所以如此特別,關(guān)鍵就在于擁有靈活的雙手,方便抓握物品和使用各類工具。機(jī)器人可以不設(shè)計成人形,但需要配備靈活的雙手,方能適配更多場景。
(圖源:AI生成)
NVIDIA CEO黃仁勛造訪香港科技大學(xué)時表示,只有自動駕駛汽車、無人機(jī)、人形機(jī)器人三類機(jī)器人有望大規(guī)模量產(chǎn)。在我們的常規(guī)理解中,一般不會把自動駕駛汽車和無人機(jī)歸類為機(jī)器人,黃仁勛的觀點幾乎等同于人形機(jī)器人是唯一可能大規(guī)模量產(chǎn)的機(jī)器人。
黃仁勛的觀點表明,未來AI不但會與機(jī)器人行業(yè)深度綁定,更將與人形機(jī)器人行業(yè)的發(fā)展息息相關(guān)。
OpenAI在投資三家實體機(jī)器人公司后,又親自下場,原因或許就在于OpenAI管理層深知,通用大模型的終局一定是通用機(jī)器人。OpenAI聯(lián)合創(chuàng)始人Wojciech Zaremba所帶領(lǐng)的團(tuán)隊,最初目的就是打造通用機(jī)器人,只是因技術(shù)、財力等原因,不得不選擇了放棄。
如今,OpenAI重組機(jī)器人團(tuán)隊再次入局,但以O(shè)penAI的實力,恐怕無法像ChatGPT一樣掀起波浪,機(jī)器人行業(yè)的技術(shù)壁壘遠(yuǎn)非AI行業(yè)可比。
不甘心只做“大腦”,OpenAI可能走錯路了?
在AI大模型領(lǐng)域,OpenAI屬于行業(yè)領(lǐng)頭羊,技術(shù)力、估值、影響力高過谷歌、亞馬遜云科技等互聯(lián)網(wǎng)巨頭,但在機(jī)器人行業(yè),OpenAI只是一家缺乏底蘊(yùn)的初創(chuàng)公司。
全球入局機(jī)器人行業(yè)的企業(yè)數(shù)不勝數(shù),如特斯拉入場并推出了人形機(jī)器人Optimus,計劃明年量產(chǎn)千臺以上;小鵬研發(fā)的AI機(jī)器人Iron,已進(jìn)入小鵬汽車工廠“打工”。小鵬汽車CEO何小鵬稱,研發(fā)機(jī)器人比新能源汽車更難,沒有500億做不好AI機(jī)器人。
研發(fā)AI大模型的投入不會比研發(fā)機(jī)器人低,但所需的是一群程序員,對于工業(yè)實力的要求不高。機(jī)器人則不同,靈活性極為重要,需要大量技術(shù)與經(jīng)驗積累,方能確保機(jī)器人的靈活性和耐用性,壓縮成本對于企業(yè)實力和工業(yè)環(huán)境的要求就更高了。
以常被談及的兩大機(jī)器人企業(yè)宇樹科技和波士頓動力為例,宇樹科技從最初便堅持電機(jī)驅(qū)動方案+機(jī)器學(xué)習(xí)算法驅(qū)動步態(tài)控制系統(tǒng),通過多種傳感器獲取地面信息,用于訓(xùn)練機(jī)器狗(四足機(jī)器人),使其可以適應(yīng)各種復(fù)雜的環(huán)境,開發(fā)出的Unitree Go2-W機(jī)器狗翻山越嶺如履平地。
(圖源:宇樹科技)
波士頓動力創(chuàng)立于1992年,比宇樹科技早24年,但因錯選液壓驅(qū)動方案,導(dǎo)致路線錯誤,后續(xù)技術(shù)出現(xiàn)了落后,各種展會上產(chǎn)品表現(xiàn)被宇樹科技吊打。因遲遲無法生產(chǎn)出投資者和消費者滿意產(chǎn)品,波士頓動力被多次賤賣,先后被軟銀、現(xiàn)代等企業(yè)收購,今年10月宣布與豐田合作,開發(fā)仿生通用機(jī)器人。
一步錯,步步錯。波士頓動力雖及時調(diào)整,轉(zhuǎn)用電機(jī)驅(qū)動方案,但已經(jīng)失去了最好的時機(jī),即便有現(xiàn)代、豐田等企業(yè)相助,也難以追上宇樹科技。
對于人形機(jī)器人,宇樹科技CEO王興興強(qiáng)調(diào),具身智能是實現(xiàn)AGI的最佳方案,大模型的發(fā)展離不開“身體”。宇樹科技已推出了H1/H2、G1等人形機(jī)器人,其中G1可以做到后空翻、快速奔跑。王興興表示,早前推出的機(jī)器狗也可以實現(xiàn)兩足奔跑,基于過去積累的技術(shù)和經(jīng)驗,才能做出H1/H2和G1。
(圖源:宇樹科技)
四年前OpenAI放棄人形機(jī)器人,現(xiàn)在就能造出人形機(jī)器人嗎?小雷給出的答案是否定的,不僅僅是OpenAI自身,就連他們投資的三家公司,最終的下場很可能也會跟波士頓動力類似,被幾次轉(zhuǎn)賣,卻始終無法生產(chǎn)出能夠令投資者和消費者滿意的產(chǎn)品。
研發(fā)AI大模型考驗的是頂尖人才數(shù)量,研發(fā)生產(chǎn)機(jī)器人,考驗的則是企業(yè)技術(shù)實力和整個國家的工業(yè)實力。特斯拉落戶上海,才實現(xiàn)大規(guī)模量產(chǎn),從破產(chǎn)倒閉的邊緣崛起。
許多發(fā)達(dá)國家正在從工業(yè)主導(dǎo)型向金融服務(wù)型轉(zhuǎn)變,美國雖多次呼吁制造業(yè)回流,但效果并不明顯。波士頓動力成立三十多年時間,卻被成立不到十年的宇樹科技吊打,原因或許也在于沒有適合他們發(fā)展的土壤。
所處環(huán)境的工業(yè)實力和企業(yè)自身的技術(shù)實力,為機(jī)器人行業(yè)筑起了極高的壁壘。沒有足夠的工業(yè)實力支持,OpenAI的人形機(jī)器人也將宛如空中樓閣。
AI驅(qū)動機(jī)器人大爆發(fā),合作才能共贏
從大語言模型到文生視頻模型,AI大模型正一步步嘗試?yán)斫馐澜纭>呱碇悄芨拍顒t將基于機(jī)器人的各類傳感器和機(jī)械結(jié)構(gòu),實現(xiàn)與環(huán)境的交互,加速訓(xùn)練AI大模型對于真實世界的理解能力。
以AI大模型為大腦,以機(jī)械結(jié)構(gòu)為身軀,屬于機(jī)器人的時代正在向我們邁進(jìn)。能夠真正理解世界的人形機(jī)器人,也將實現(xiàn)我們對其最初的期待:機(jī)器人完成繁瑣的家務(wù)勞動,人類則能夠騰出時間沉浸在藝術(shù)的海洋。
不過距離機(jī)器人技術(shù)和產(chǎn)品成熟,還需要很長一段時間。也正如新能源汽車行業(yè)的發(fā)展歷程,初期只有財力雄厚的消費者才能夠買得起,后期則可能降低至“白菜價”,走進(jìn)千家萬戶。
(圖源:AI生成)
對于企業(yè)而言,是否該進(jìn)入人形機(jī)器人行業(yè)需三思而行。以O(shè)penAI為例,從該企業(yè)對待中國用戶的態(tài)度不難看出,大概率不會在中國建造工廠,其投資的機(jī)器人公司,兩家位于美國,一家位于挪威,沒有足夠的工業(yè)實力支撐,量產(chǎn)恐怕不會容易。
小雷認(rèn)為,OpenAI最好的路線還是專注于AI大模型的研發(fā),利用在AI大模型領(lǐng)域的優(yōu)勢,為人形機(jī)器人訓(xùn)練聰明的大腦,將ChatGPT打造成機(jī)器人行業(yè)的安卓,甚至考慮如安卓一般開源系統(tǒng),快速搶占上游生態(tài)位。
在經(jīng)濟(jì)全球化的今天,一家企業(yè)乃至一個國家,都難以實現(xiàn)行業(yè)上下游產(chǎn)業(yè)通吃。美國互聯(lián)網(wǎng)巨頭眾多,在AI技術(shù)和半導(dǎo)體方面也取得了一定的領(lǐng)先,中國則在工業(yè)層面更具優(yōu)勢,機(jī)器人所需的電機(jī)、電池等都可以生產(chǎn),并且可以有效控制成本。中美企業(yè)相互合作,才能加快機(jī)器人行業(yè)的發(fā)展速度,最終實現(xiàn)機(jī)器人普及和下沉市場的目標(biāo)。
25年1月7日,CES(國際消費電子展) 2025 即將盛大開幕,雷科技報道團(tuán)蓄勢待發(fā),即將飛赴美國拉斯維加斯現(xiàn)場全程報道,敬請關(guān)注。