當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人物報(bào)道 > 對(duì)標(biāo)李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機(jī)器人理解物理世界

對(duì)標(biāo)李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機(jī)器人理解物理世界
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-14 09:14:15 瀏覽：1594次

導(dǎo)讀：劃重點(diǎn) 01前華為美研CTO胡魯輝回國創(chuàng)業(yè)，創(chuàng)辦智澄AI，旨在讓人工智能直接感知、理解物理世界并進(jìn)行交互。 02胡魯輝曾在微軟、亞馬遜、華為美國研究院、Meta等頂尖科技巨頭擔(dān)任高管，擁有30+專利。 03智澄AI推出低成本通用人工智能機(jī)器人學(xué)習(xí)框架GRLF，使機(jī)械...

劃重點(diǎn)

01前華為美研CTO胡魯輝回國創(chuàng)業(yè)，創(chuàng)辦智澄AI，旨在讓人工智能直接感知、理解物理世界并進(jìn)行交互。

02胡魯輝曾在微軟、亞馬遜、華為美國研究院、Meta等頂尖科技巨頭擔(dān)任高管，擁有30+專利。

03智澄AI推出低成本通用人工智能機(jī)器人學(xué)習(xí)框架GRLF，使機(jī)械臂具備視覺能力和感知能力。

04然而，通用人工智能仍面臨諸多挑戰(zhàn)，如算力、數(shù)據(jù)量等方面的差距。

05胡魯輝預(yù)計(jì)，通用人工智能實(shí)現(xiàn)還需3到5年，屆時(shí)將重新定義人們的生活方式。

以上內(nèi)容由騰訊混元大模型生成，僅供參考

機(jī)器人前瞻（公眾號(hào)：robot_pro）

作者 | 許麗思

編輯 |漠影

在柏拉圖的洞穴隱喻里，一群一輩子沒出過山洞的人，對(duì)外界唯一的感知來源是投射在洞里墻壁上的影子。他們可以借助影子了解到外界的一些情況，但影子對(duì)真實(shí)世界的投射不一定是完全真實(shí)的。

現(xiàn)在的人工智能，也像處于“洞穴”之中，它對(duì)外界的理解來自于人為提供的二手信息，還沒辦法直接去感受真實(shí)世界、獲取一手信息。

而對(duì)胡魯輝來說，他想做的就是讓人工智能可以直接感知、理解物理世界，然后進(jìn)行交互，從而逐步接近通用人工智能。

在清華大學(xué)、美國留學(xué)深造后，進(jìn)入微軟、亞馬遜、華為美國研究院、Meta這樣的頂尖科技巨頭擔(dān)任高管，胡魯輝的履歷堪稱優(yōu)秀。

前年年底，他萌發(fā)了“理解物理世界”的想法。今年，他下決心回國再創(chuàng)業(yè)，創(chuàng)辦了智澄AI，“澄”的意思就是逐步走向真正的智能。“目前，國內(nèi)還沒有類似企業(yè)。我們對(duì)標(biāo)的是美國李飛飛老師創(chuàng)辦的空間智能公司。”胡魯輝說。

AI 2.0時(shí)代的到來意味著什么？給機(jī)器人裝上模型就可以讓它實(shí)現(xiàn)具身智能？通用人工智能將會(huì)創(chuàng)造出機(jī)器人的“iPhone時(shí)刻”？最近，機(jī)器人前瞻和智澄AI創(chuàng)始人胡魯輝進(jìn)行了一場(chǎng)深入交談，從他毅然轉(zhuǎn)向的事業(yè)發(fā)展路徑背后，看到了從多模態(tài)大模型到物理智能，實(shí)現(xiàn)通用人工智能的新答案。

對(duì)標(biāo)李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機(jī)器人理解物理世界

▲前Meta首席工程師、智澄AI創(chuàng)始人胡魯輝

一、擔(dān)任過多家科技巨頭高管，手握30+專利

早年在清華大學(xué)畢業(yè)后胡魯輝就收到了美國西北大學(xué)等多所高校博士錄取通知，赴美深造。畢業(yè)后，他選擇留在西雅圖，在這樣一座匯集了一眾世界頂尖科技巨頭的城市工作。

他先是在微軟和亞馬遜總部工作了十來年，后面又加入華為美國研究院擔(dān)任首席架構(gòu)師兼首席技術(shù)官，最近的一段經(jīng)歷是在Meta擔(dān)任首席工程負(fù)責(zé)人，負(fù)責(zé)數(shù)據(jù)人工智能方面的工作。

除了各大科技巨頭的高管頭銜，他的從業(yè)生涯中濃墨重彩的一筆，是在美國獲得的三十多項(xiàng)發(fā)明專利及申請(qǐng)。在這些專利里，胡魯輝作為主要負(fù)責(zé)人，基本都是第一作者。

胡魯輝回憶起在2010年前后，負(fù)責(zé)了一個(gè)亞馬遜線下零售的項(xiàng)目。原本亞馬遜主攻線上業(yè)務(wù)，后來想要拓展以無人店為代表的線下業(yè)務(wù)。但管理線下的商品銷售就需要人工流程，這可能會(huì)耗費(fèi)時(shí)間和成本，并且可能難以準(zhǔn)確地做出商業(yè)決策。

最初，他選擇用軟件處理這種問題。后來，他開始研發(fā)人工智能，還獲得了一個(gè)“用于線下零售業(yè)務(wù)的數(shù)據(jù)驅(qū)動(dòng)和自適應(yīng)機(jī)器學(xué)習(xí)（ML）平臺(tái)和技術(shù)”的專利，可以讓多個(gè)機(jī)器學(xué)習(xí)算法為線下零售提供多樣化的支持。

這是胡魯輝第一個(gè)與AI相關(guān)的專利發(fā)明，也是從這里開始，他可以說是真正對(duì)AI領(lǐng)域產(chǎn)生了濃厚的興趣。那個(gè)時(shí)候，AI尚未到火爆、備受關(guān)注的程度。

對(duì)標(biāo)李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機(jī)器人理解物理世界

▲胡魯輝第一個(gè)與AI相關(guān)的專利

二、瞄準(zhǔn)AI 2.0的機(jī)會(huì)，再次投身創(chuàng)業(yè)浪潮

2015年，以CNN卷積神經(jīng)網(wǎng)絡(luò)模型為核心的計(jì)算機(jī)視覺技術(shù)，正式拉開了AI 1.0感知智能時(shí)代的序幕。2016年，AlphaGo擊敗圍棋世界冠軍李世石，AI迎來了重要的高光時(shí)刻，受到廣泛關(guān)注。

在AI 1.0時(shí)代，胡魯輝看中了其中的機(jī)遇，選擇在2018年回國，奔赴上海、北京兩地創(chuàng)業(yè)。

“那次創(chuàng)業(yè)，主要聚焦在智慧零售方面的人工智能技術(shù)的應(yīng)用，”胡魯輝說，“當(dāng)時(shí)AI技術(shù)的特點(diǎn)是垂直性特別強(qiáng)，需要在垂直領(lǐng)域進(jìn)行應(yīng)用，也和永輝、京東、騰訊等平臺(tái)進(jìn)行了合作。”

而現(xiàn)在，當(dāng)AI已經(jīng)邁入2.0時(shí)代，帶來了平臺(tái)式的變革。

在胡魯輝看來，AI 2.0時(shí)代蘊(yùn)藏著比上一個(gè)時(shí)代更多的機(jī)會(huì)，會(huì)對(duì)人類的生活、工作、產(chǎn)業(yè)等產(chǎn)生更大的影響，并且還更容易落地。

所以，他的第二次創(chuàng)業(yè)開始了。他找到了之前在微軟、華為、Meta的一些同事，組成了公司的核心創(chuàng)始團(tuán)隊(duì)，公司的研發(fā)團(tuán)隊(duì)也基本都是畢業(yè)于國內(nèi)外知名高校的碩士、博士、博士后。

面對(duì)深圳、上海等地發(fā)出的落地邀約，老家在浙江寧波的胡魯輝最終決定將公司設(shè)立在杭州的菜鳥智谷產(chǎn)業(yè)園。

智澄AI的成立，還得到了投資界、政府部門等多方面的支持。

胡魯輝表示，公司在成立前就已成功融資，不久后投資人還繼續(xù)追加投資。同時(shí)當(dāng)?shù)卣块T也很重視，把智澄評(píng)為AI杭州市余杭區(qū)海外高層次領(lǐng)軍人才項(xiàng)目，還在資金等多方面給予大力支持。

對(duì)標(biāo)李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機(jī)器人理解物理世界

▲今年7月，智澄AI在杭州開業(yè)

三、低成本機(jī)械臂，也能實(shí)現(xiàn)具身智能

在AI 2.0時(shí)代，下一個(gè)爆發(fā)點(diǎn)及落地大方向?qū)⑹茿I for Robotics，而智澄AI正是瞄準(zhǔn)了這一點(diǎn)。

“我們是一家通用人工智能公司，核心技術(shù)是理解物理世界的模型，”胡魯輝解釋道，“但是我們的產(chǎn)品并非是模型，而是具身智能，也就是人工智能機(jī)器人。”

從前年年底，胡魯輝就誕生了讓人工智能理解物理世界的想法，并開始思考如何實(shí)施。這就要求模型不僅理解編程或語言處理，更要深入到物理世界的具體應(yīng)用中去。

今年5月開始，智澄AI的人工智能機(jī)器人原型一（TR1）、原型二(TR2)基本完成，已經(jīng)進(jìn)入了生產(chǎn)環(huán)節(jié)，并且和一些企業(yè)達(dá)成了合作，開始了商業(yè)化之路。胡魯輝將智澄AI的人工智能機(jī)器人命名為TR，即TransformingRobot。

“雖然模型研發(fā)的時(shí)間比較長(zhǎng)，但是集成智能本體的時(shí)間較短，迭代速度也很快，現(xiàn)在基本上兩個(gè)月就實(shí)現(xiàn)了一次迭代。”胡魯輝說。

對(duì)標(biāo)李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機(jī)器人理解物理世界

▲智澄AI的TR2雙臂機(jī)器人

不久前，智澄AI聯(lián)合了來自哈佛大學(xué)、清華大學(xué)的人工智能專家，推出了一種低成本的通用人工智能機(jī)器人學(xué)習(xí)框架（GRLF）。

把這個(gè)框架裝在機(jī)械臂上，機(jī)械臂仿佛變成了具有視覺能力、感知能力的個(gè)體，能夠像人一樣去執(zhí)行精細(xì)的模仿學(xué)習(xí)任務(wù)。

它可以完全擺脫對(duì)仿真環(huán)境的依賴，實(shí)現(xiàn)從數(shù)據(jù)采集、模型訓(xùn)練到模型部署的端到端實(shí)景操作，還可以對(duì)多種物體進(jìn)行放置、排序、操縱，具備了一定的通用能力。

對(duì)標(biāo)李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機(jī)器人理解物理世界

▲裝上了通用人工智能機(jī)器人學(xué)習(xí)框架的機(jī)械臂正在執(zhí)行不同的任務(wù)

縱觀目前的機(jī)器人行業(yè)，胡魯輝覺得，許多企業(yè)的產(chǎn)品還處于演示、研究和教育的階段，難以實(shí)現(xiàn)機(jī)器人真正的應(yīng)用。機(jī)器人行業(yè)不僅面臨著成本高、價(jià)格高的挑戰(zhàn)，還存在泛化能力不足的問題，機(jī)器人難以適應(yīng)不同場(chǎng)景需求和環(huán)境。

所以，他希望智澄AI能夠?qū)⑼ㄓ萌斯ぶ悄苷嬲龖?yīng)用到大眾的工作和生活中，讓機(jī)器人實(shí)現(xiàn)像人一樣的智能。

“很多公司都專注于制造機(jī)器人，讓機(jī)器人能夠完成某項(xiàng)工作。但我們想做的是能夠感知、理解物理世界的機(jī)器人，它具有推理和思考能力，能夠與外界進(jìn)行智能的交互，而目前國內(nèi)還沒有這類企業(yè)。”胡魯輝說。

在他的計(jì)劃里，智澄AI會(huì)繼續(xù)圍繞實(shí)際應(yīng)用場(chǎng)景、通過技術(shù)創(chuàng)新和突破來加快產(chǎn)品的迭代，并且繼續(xù)推進(jìn)和不同企業(yè)的合作，讓產(chǎn)品的應(yīng)用落到實(shí)地。

四、對(duì)標(biāo)李飛飛，讓AI走出“洞穴”

要讓AI走出“洞穴”，就需要AI直接接觸真實(shí)的物理世界。

今年4月，“AI教母”李飛飛創(chuàng)辦了一家“致力于構(gòu)建能夠感知、生成并與 3D 世界互動(dòng)的大型世界模型的空間智能公司”World Labs 。

“我們現(xiàn)在看到的大型語言模型和多模態(tài)語言模型，它們是底層表達(dá)其實(shí)是一種一維表示，”李飛飛在此前接受的公開采訪中曾說道，“而空間智能是對(duì)世界的三維表達(dá)，從算法的角度來看，這是在用不同方式處理數(shù)據(jù)并從中獲得不同類型的輸出，最后解決不同的問題。”

簡(jiǎn)單來說，李飛飛的空間智能就是要讓人工智能直接繞過一切中間障礙，直接地感受、理解所身處的三維世界，然后采取一些行動(dòng)。

而胡魯輝的想法，剛好和李飛飛不謀而合。

前年年底，他萌生出了“理解物理世界”的想法。“最初，我們關(guān)于物理智能的想法其實(shí)沒有多少人接受，畢竟這是比較有挑戰(zhàn)性的，”胡魯輝說，“通用人工智能有不同的實(shí)現(xiàn)方式，很多人都在探索，但通常都會(huì)采用大模型的方式。”

但是他認(rèn)為，現(xiàn)有的多模態(tài)大模型只能局限于訓(xùn)練的范圍中，對(duì)外界的理解還是有很大局限性。只有讓人工智能做真正理解物理世界，才能實(shí)現(xiàn)通用。

這也正是胡魯輝創(chuàng)辦智澄AI的愿景所在。

不過，在走向通用人工智能的路上，還是面臨著不少的阻礙，不僅包括在算力、數(shù)據(jù)、算法方面，也包括在真正的實(shí)際應(yīng)用落地上。胡魯輝歸納出了“兩個(gè)20”來概括當(dāng)前人工智能發(fā)展的差距：

第一個(gè)“20”是從算力的角度，他提到如果讓AI和人同時(shí)創(chuàng)作一首詩或一幅畫，人可能只需要要20瓦的電量，而AI需要耗費(fèi)巨大的電量，并且像OpenAI大模型的訓(xùn)練經(jīng)常需要耗費(fèi)數(shù)億美元。

第二個(gè)“20”是從數(shù)據(jù)量的角度，人類可能花費(fèi)20小時(shí)就能掌握很復(fù)雜的事情，例如學(xué)車，但是AI可能要花費(fèi)數(shù)億個(gè)小時(shí)的數(shù)據(jù)進(jìn)行訓(xùn)練。

要實(shí)現(xiàn)通用人工智能，還是道阻且長(zhǎng)。

五、結(jié)語：AGI的到來，會(huì)是機(jī)器人的“iPhone”時(shí)刻”

通用人工智能，到底還需要多久才會(huì)到來呢？

沿著物理智能的路徑，胡魯輝覺得，可能還需要3到5年左右。而等到通用人工智能實(shí)現(xiàn)的那一刻的到來，也將會(huì)給機(jī)器人領(lǐng)域帶來顛覆性的變革。

這是機(jī)器人“iPhone 時(shí)刻”。就如同當(dāng)年iPhone的橫空出世，它作為一個(gè)突破性的硬件平臺(tái)，帶動(dòng)了整個(gè)軟件應(yīng)用生態(tài)的發(fā)展一樣，通用人工智能也會(huì)創(chuàng)造出一個(gè)蘊(yùn)含著巨大價(jià)值的生態(tài)。

它作為一個(gè)相對(duì)標(biāo)準(zhǔn)化的模型、軟件，會(huì)走向平臺(tái)化，可以廣泛地應(yīng)用到不同的機(jī)器人上，重新定義人們的生活方式。

那個(gè)時(shí)候，機(jī)器人會(huì)成為一個(gè)更為廣泛的概念，不止是我們現(xiàn)在所熟悉的人形機(jī)器人，而是一切都會(huì)走向機(jī)器人化，重新定義每個(gè)人的生活方式。

這個(gè)時(shí)刻的曙光，已經(jīng)逐漸顯現(xiàn)了。

上一篇：AI連摘諾獎(jiǎng)后：AI教父Diss OpenAI，馬斯克借機(jī)拉踩，端到端怎么走

下一篇：Counterpoint：2024Q2 AI 服務(wù)器全球市場(chǎng)占比達(dá) 29%

對(duì)標(biāo)李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機(jī)器人理解物理世界
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-14 09:14:15 瀏覽：1594次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

對(duì)標(biāo)李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機(jī)器人理解物理世界 來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-14 09:14:15 瀏覽：1594次

相關(guān)內(nèi)容

AiLab云推薦

最新資訊

本月熱點(diǎn)

熱門排行

推薦內(nèi)容

在線客服

熱門欄目HotCates

關(guān)于我們

版權(quán)聲明

對(duì)標(biāo)李飛飛！前華為美研CTO創(chuàng)業(yè)，要讓機(jī)器人理解物理世界
來源：互聯(lián)網(wǎng) 發(fā)布日期：2024-10-14 09:14:15 瀏覽：1594次