展會(huì)信息港展會(huì)大全

對(duì)標(biāo)李飛飛!前華為美研CTO創(chuàng)業(yè),要讓機(jī)器人理解物理世界
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-10-14 09:14:15   瀏覽:1478次  

導(dǎo)讀:劃重點(diǎn) 01前華為美研CTO胡魯輝回國創(chuàng)業(yè),創(chuàng)辦智澄AI,旨在讓人工智能直接感知、理解物理世界并進(jìn)行交互。 02胡魯輝曾在微軟、亞馬遜、華為美國研究院、Meta等頂尖科技巨頭擔(dān)任高管,擁有30+專利。 03智澄AI推出低成本通用人工智能機(jī)器人學(xué)習(xí)框架GRLF,使機(jī)械...

劃重點(diǎn)

01前華為美研CTO胡魯輝回國創(chuàng)業(yè),創(chuàng)辦智澄AI,旨在讓人工智能直接感知、理解物理世界并進(jìn)行交互。

02胡魯輝曾在微軟、亞馬遜、華為美國研究院、Meta等頂尖科技巨頭擔(dān)任高管,擁有30+專利。

03智澄AI推出低成本通用人工智能機(jī)器人學(xué)習(xí)框架GRLF,使機(jī)械臂具備視覺能力和感知能力。

04然而,通用人工智能仍面臨諸多挑戰(zhàn),如算力、數(shù)據(jù)量等方面的差距。

05胡魯輝預(yù)計(jì),通用人工智能實(shí)現(xiàn)還需3到5年,屆時(shí)將重新定義人們的生活方式。

以上內(nèi)容由騰訊混元大模型生成,僅供參考

機(jī)器人前瞻(公眾號(hào):robot_pro)

作者 | 許麗思

編輯 |漠影

在柏拉圖的洞穴隱喻里,一群一輩子沒出過山洞的人,對(duì)外界唯一的感知來源是投射在洞里墻壁上的影子。他們可以借助影子了解到外界的一些情況,但影子對(duì)真實(shí)世界的投射不一定是完全真實(shí)的。

現(xiàn)在的人工智能,也像處于“洞穴”之中,它對(duì)外界的理解來自于人為提供的二手信息,還沒辦法直接去感受真實(shí)世界、獲取一手信息。

而對(duì)胡魯輝來說,他想做的就是讓人工智能可以直接感知、理解物理世界,然后進(jìn)行交互,從而逐步接近通用人工智能。

在清華大學(xué)、美國留學(xué)深造后,進(jìn)入微軟、亞馬遜、華為美國研究院、Meta這樣的頂尖科技巨頭擔(dān)任高管,胡魯輝的履歷堪稱優(yōu)秀。

前年年底,他萌發(fā)了“理解物理世界”的想法。今年,他下決心回國再創(chuàng)業(yè),創(chuàng)辦了智澄AI,“澄”的意思就是逐步走向真正的智能。“目前,國內(nèi)還沒有類似企業(yè)。我們對(duì)標(biāo)的是美國李飛飛老師創(chuàng)辦的空間智能公司。”胡魯輝說。

AI 2.0時(shí)代的到來意味著什么?給機(jī)器人裝上模型就可以讓它實(shí)現(xiàn)具身智能?通用人工智能將會(huì)創(chuàng)造出機(jī)器人的“iPhone時(shí)刻”?最近,機(jī)器人前瞻和智澄AI創(chuàng)始人胡魯輝進(jìn)行了一場(chǎng)深入交談,從他毅然轉(zhuǎn)向的事業(yè)發(fā)展路徑背后,看到了從多模態(tài)大模型到物理智能,實(shí)現(xiàn)通用人工智能的新答案。

對(duì)標(biāo)李飛飛!前華為美研CTO創(chuàng)業(yè),要讓機(jī)器人理解物理世界

▲前Meta首席工程師、智澄AI創(chuàng)始人 胡魯輝

一、擔(dān)任過多家科技巨頭高管,手握30+專利

早年在清華大學(xué)畢業(yè)后胡魯輝就收到了美國西北大學(xué)等多所高校博士錄取通知,赴美深造。畢業(yè)后,他選擇留在西雅圖,在這樣一座匯集了一眾世界頂尖科技巨頭的城市工作。

他先是在微軟和亞馬遜總部工作了十來年,后面又加入華為美國研究院擔(dān)任首席架構(gòu)師兼首席技術(shù)官,最近的一段經(jīng)歷是在Meta擔(dān)任首席工程負(fù)責(zé)人,負(fù)責(zé)數(shù)據(jù)人工智能方面的工作。

除了各大科技巨頭的高管頭銜,他的從業(yè)生涯中濃墨重彩的一筆,是在美國獲得的三十多項(xiàng)發(fā)明專利及申請(qǐng)。在這些專利里,胡魯輝作為主要負(fù)責(zé)人,基本都是第一作者。

胡魯輝回憶起在2010年前后,負(fù)責(zé)了一個(gè)亞馬遜線下零售的項(xiàng)目。原本亞馬遜主攻線上業(yè)務(wù),后來想要拓展以無人店為代表的線下業(yè)務(wù)。但管理線下的商品銷售就需要人工流程,這可能會(huì)耗費(fèi)時(shí)間和成本,并且可能難以準(zhǔn)確地做出商業(yè)決策。

最初,他選擇用軟件處理這種問題。后來,他開始研發(fā)人工智能,還獲得了一個(gè)“用于線下零售業(yè)務(wù)的數(shù)據(jù)驅(qū)動(dòng)和自適應(yīng)機(jī)器學(xué)習(xí)(ML)平臺(tái)和技術(shù)”的專利,可以讓多個(gè)機(jī)器學(xué)習(xí)算法為線下零售提供多樣化的支持。

這是胡魯輝第一個(gè)與AI相關(guān)的專利發(fā)明,也是從這里開始,他可以說是真正對(duì)AI領(lǐng)域產(chǎn)生了濃厚的興趣。那個(gè)時(shí)候,AI尚未到火爆、備受關(guān)注的程度。

對(duì)標(biāo)李飛飛!前華為美研CTO創(chuàng)業(yè),要讓機(jī)器人理解物理世界

▲胡魯輝第一個(gè)與AI相關(guān)的專利

二、瞄準(zhǔn)AI 2.0的機(jī)會(huì),再次投身創(chuàng)業(yè)浪潮

2015年,以CNN卷積神經(jīng)網(wǎng)絡(luò)模型為核心的計(jì)算機(jī)視覺技術(shù),正式拉開了AI 1.0感知智能時(shí)代的序幕。2016年,AlphaGo擊敗圍棋世界冠軍李世石,AI迎來了重要的高光時(shí)刻,受到廣泛關(guān)注。

在AI 1.0時(shí)代,胡魯輝看中了其中的機(jī)遇,選擇在2018年回國,奔赴上海、北京兩地創(chuàng)業(yè)。

“那次創(chuàng)業(yè),主要聚焦在智慧零售方面的人工智能技術(shù)的應(yīng)用,”胡魯輝說,“當(dāng)時(shí)AI技術(shù)的特點(diǎn)是垂直性特別強(qiáng),需要在垂直領(lǐng)域進(jìn)行應(yīng)用,也和永輝、京東、騰訊等平臺(tái)進(jìn)行了合作。”

而現(xiàn)在,當(dāng)AI已經(jīng)邁入2.0時(shí)代,帶來了平臺(tái)式的變革。

在胡魯輝看來,AI 2.0時(shí)代蘊(yùn)藏著比上一個(gè)時(shí)代更多的機(jī)會(huì),會(huì)對(duì)人類的生活、工作、產(chǎn)業(yè)等產(chǎn)生更大的影響,并且還更容易落地。

所以,他的第二次創(chuàng)業(yè)開始了。他找到了之前在微軟、華為、Meta的一些同事,組成了公司的核心創(chuàng)始團(tuán)隊(duì),公司的研發(fā)團(tuán)隊(duì)也基本都是畢業(yè)于國內(nèi)外知名高校的碩士、博士、博士后。

面對(duì)深圳、上海等地發(fā)出的落地邀約,老家在浙江寧波的胡魯輝最終決定將公司設(shè)立在杭州的菜鳥智谷產(chǎn)業(yè)園。

智澄AI的成立,還得到了投資界、政府部門等多方面的支持。

胡魯輝表示,公司在成立前就已成功融資,不久后投資人還繼續(xù)追加投資。同時(shí)當(dāng)?shù)卣块T也很重視,把智澄評(píng)為AI杭州市余杭區(qū)海外高層次領(lǐng)軍人才項(xiàng)目,還在資金等多方面給予大力支持。

對(duì)標(biāo)李飛飛!前華為美研CTO創(chuàng)業(yè),要讓機(jī)器人理解物理世界

▲今年7月,智澄AI在杭州開業(yè)

三、低成本機(jī)械臂,也能實(shí)現(xiàn)具身智能

在AI 2.0時(shí)代,下一個(gè)爆發(fā)點(diǎn)及落地大方向?qū)⑹茿I for Robotics,而智澄AI正是瞄準(zhǔn)了這一點(diǎn)。

“我們是一家通用人工智能公司,核心技術(shù)是理解物理世界的模型,”胡魯輝解釋道,“但是我們的產(chǎn)品并非是模型,而是具身智能,也就是人工智能機(jī)器人。”

從前年年底,胡魯輝就誕生了讓人工智能理解物理世界的想法,并開始思考如何實(shí)施。這就要求模型不僅理解編程或語言處理,更要深入到物理世界的具體應(yīng)用中去。

今年5月開始,智澄AI的人工智能機(jī)器人原型一(TR1)、原型二(TR2)基本完成,已經(jīng)進(jìn)入了生產(chǎn)環(huán)節(jié),并且和一些企業(yè)達(dá)成了合作,開始了商業(yè)化之路。胡魯輝將智澄AI的人工智能機(jī)器人命名為TR,即TransformingRobot。

“雖然模型研發(fā)的時(shí)間比較長(zhǎng),但是集成智能本體的時(shí)間較短,迭代速度也很快,現(xiàn)在基本上兩個(gè)月就實(shí)現(xiàn)了一次迭代。”胡魯輝說。

對(duì)標(biāo)李飛飛!前華為美研CTO創(chuàng)業(yè),要讓機(jī)器人理解物理世界

對(duì)標(biāo)李飛飛!前華為美研CTO創(chuàng)業(yè),要讓機(jī)器人理解物理世界

▲智澄AI的TR2雙臂機(jī)器人

不久前,智澄AI聯(lián)合了來自哈佛大學(xué)、清華大學(xué)的人工智能專家,推出了一種低成本的通用人工智能機(jī)器人學(xué)習(xí)框架(GRLF)。

把這個(gè)框架裝在機(jī)械臂上,機(jī)械臂仿佛變成了具有視覺能力、感知能力的個(gè)體,能夠像人一樣去執(zhí)行精細(xì)的模仿學(xué)習(xí)任務(wù)。

它可以完全擺脫對(duì)仿真環(huán)境的依賴,實(shí)現(xiàn)從數(shù)據(jù)采集、模型訓(xùn)練到模型部署的端到端實(shí)景操作,還可以對(duì)多種物體進(jìn)行放置、排序、操縱,具備了一定的通用能力。

對(duì)標(biāo)李飛飛!前華為美研CTO創(chuàng)業(yè),要讓機(jī)器人理解物理世界

▲裝上了通用人工智能機(jī)器人學(xué)習(xí)框架的機(jī)械臂正在執(zhí)行不同的任務(wù)

縱觀目前的機(jī)器人行業(yè),胡魯輝覺得,許多企業(yè)的產(chǎn)品還處于演示、研究和教育的階段,難以實(shí)現(xiàn)機(jī)器人真正的應(yīng)用。機(jī)器人行業(yè)不僅面臨著成本高、價(jià)格高的挑戰(zhàn),還存在泛化能力不足的問題,機(jī)器人難以適應(yīng)不同場(chǎng)景需求和環(huán)境。

所以,他希望智澄AI能夠?qū)⑼ㄓ萌斯ぶ悄苷嬲龖?yīng)用到大眾的工作和生活中,讓機(jī)器人實(shí)現(xiàn)像人一樣的智能。

“很多公司都專注于制造機(jī)器人,讓機(jī)器人能夠完成某項(xiàng)工作。但我們想做的是能夠感知、理解物理世界的機(jī)器人,它具有推理和思考能力,能夠與外界進(jìn)行智能的交互,而目前國內(nèi)還沒有這類企業(yè)。”胡魯輝說。

在他的計(jì)劃里,智澄AI會(huì)繼續(xù)圍繞實(shí)際應(yīng)用場(chǎng)景、通過技術(shù)創(chuàng)新和突破來加快產(chǎn)品的迭代,并且繼續(xù)推進(jìn)和不同企業(yè)的合作,讓產(chǎn)品的應(yīng)用落到實(shí)地。

四、對(duì)標(biāo)李飛飛,讓AI走出“洞穴”

要讓AI走出“洞穴”,就需要AI直接接觸真實(shí)的物理世界。

今年4月,“AI教母”李飛飛創(chuàng)辦了一家“致力于構(gòu)建能夠感知、生成并與 3D 世界互動(dòng)的大型世界模型的空間智能公司”World Labs 。

“我們現(xiàn)在看到的大型語言模型和多模態(tài)語言模型,它們是底層表達(dá)其實(shí)是一種一維表示,”李飛飛在此前接受的公開采訪中曾說道,“而空間智能是對(duì)世界的三維表達(dá),從算法的角度來看,這是在用不同方式處理數(shù)據(jù)并從中獲得不同類型的輸出,最后解決不同的問題。”

簡(jiǎn)單來說,李飛飛的空間智能就是要讓人工智能直接繞過一切中間障礙,直接地感受、理解所身處的三維世界,然后采取一些行動(dòng)。

而胡魯輝的想法,剛好和李飛飛不謀而合。

前年年底,他萌生出了“理解物理世界”的想法。“最初,我們關(guān)于物理智能的想法其實(shí)沒有多少人接受,畢竟這是比較有挑戰(zhàn)性的,”胡魯輝說,“通用人工智能有不同的實(shí)現(xiàn)方式,很多人都在探索,但通常都會(huì)采用大模型的方式。”

但是他認(rèn)為,現(xiàn)有的多模態(tài)大模型只能局限于訓(xùn)練的范圍中,對(duì)外界的理解還是有很大局限性。只有讓人工智能做真正理解物理世界,才能實(shí)現(xiàn)通用。

這也正是胡魯輝創(chuàng)辦智澄AI的愿景所在。

不過,在走向通用人工智能的路上,還是面臨著不少的阻礙,不僅包括在算力、數(shù)據(jù)、算法方面,也包括在真正的實(shí)際應(yīng)用落地上。胡魯輝歸納出了“兩個(gè)20”來概括當(dāng)前人工智能發(fā)展的差距:

第一個(gè)“20”是從算力的角度,他提到如果讓AI和人同時(shí)創(chuàng)作一首詩或一幅畫,人可能只需要要20瓦的電量,而AI需要耗費(fèi)巨大的電量,并且像OpenAI大模型的訓(xùn)練經(jīng)常需要耗費(fèi)數(shù)億美元。

第二個(gè)“20”是從數(shù)據(jù)量的角度,人類可能花費(fèi)20小時(shí)就能掌握很復(fù)雜的事情,例如學(xué)車,但是AI可能要花費(fèi)數(shù)億個(gè)小時(shí)的數(shù)據(jù)進(jìn)行訓(xùn)練。

要實(shí)現(xiàn)通用人工智能,還是道阻且長(zhǎng)。

五、結(jié)語:AGI的到來,會(huì)是機(jī)器人的“iPhone”時(shí)刻”

通用人工智能,到底還需要多久才會(huì)到來呢?

沿著物理智能的路徑,胡魯輝覺得,可能還需要3到5年左右。而等到通用人工智能實(shí)現(xiàn)的那一刻的到來,也將會(huì)給機(jī)器人領(lǐng)域帶來顛覆性的變革。

這是機(jī)器人“iPhone 時(shí)刻”。就如同當(dāng)年iPhone的橫空出世,它作為一個(gè)突破性的硬件平臺(tái),帶動(dòng)了整個(gè)軟件應(yīng)用生態(tài)的發(fā)展一樣,通用人工智能也會(huì)創(chuàng)造出一個(gè)蘊(yùn)含著巨大價(jià)值的生態(tài)。

它作為一個(gè)相對(duì)標(biāo)準(zhǔn)化的模型、軟件,會(huì)走向平臺(tái)化,可以廣泛地應(yīng)用到不同的機(jī)器人上,重新定義人們的生活方式。

那個(gè)時(shí)候,機(jī)器人會(huì)成為一個(gè)更為廣泛的概念,不止是我們現(xiàn)在所熟悉的人形機(jī)器人,而是一切都會(huì)走向機(jī)器人化,重新定義每個(gè)人的生活方式。

這個(gè)時(shí)刻的曙光,已經(jīng)逐漸顯現(xiàn)了。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港