展會信息港展會大全

訓練成本有望減半,智元開源機器人數(shù)據(jù)集
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-12-30 12:55:04   瀏覽:378次  

導讀:12月30日,智元機器人宣布開源 AgiBot World(智元世界)。智元機器人稱, AgiBot World是一個匯集百萬真實機器人數(shù)據(jù)的開源數(shù)據(jù)集。根據(jù)智元披露內(nèi)容,AgiBot World包含超過100種真實場景,40%為家居場景,20%為餐飲場景,20%為工業(yè)場景,商超和辦公場景各占10%。數(shù)據(jù)集收錄了八十余種人類日常生活中的技能,包括抓取、放置、推、拉、攪拌、折疊、熨燙等動作。智元表示,該數(shù) ......

訓練成本有望減半,智元開源機器人數(shù)據(jù)集

12月30日,智元機器人宣布開源 AgiBot World(智元世界)。智元機器人稱, AgiBot World是一個匯集百萬真實機器人數(shù)據(jù)的開源數(shù)據(jù)集。

根據(jù)智元披露內(nèi)容,AgiBot World包含超過100種真實場景,40%為家居場景,20%為餐飲場景,20%為工業(yè)場景,商超和辦公場景各占10%。數(shù)據(jù)集收錄了八十余種人類日常生活中的技能,包括抓取、放置、推、拉、攪拌、折疊、熨燙等動作。智元表示,該數(shù)據(jù)集包含了三千多種物品,80%的任務為長程任務,時長集中在60s-150s之間。

智元機器人表示,相比于Google開源的Open X-Embodiment數(shù)據(jù)集,AgiBot World的長程數(shù)據(jù)規(guī)模高出10倍,場景范圍覆蓋面擴大100倍,數(shù)據(jù)質量從實驗室級上升到工業(yè)級標準。

開源AgiBot World,智元機器人的一盤大棋布局已久。本次開源的AgiBot World 數(shù)據(jù)集誕生于空間總面積超過4000平方米的智元機器人數(shù)據(jù)采集工廠與應用實驗基地。在12月中旬智元機器人宣布量產(chǎn)時,智元相關負責人向第一財經(jīng)記者透露,截至今年年底,智元機器人計劃交付962臺,主要是用于交互服務和數(shù)據(jù)采集場景。而智元上海臨港量產(chǎn)工廠也在今年10月投產(chǎn),通過體系化、標準化的機器人生產(chǎn)流水線,能夠實現(xiàn)規(guī);庸どa(chǎn)機器人。

訓練成本有望減半,智元開源機器人數(shù)據(jù)集

“高質量數(shù)據(jù)的匱乏,實際上是阻礙當前人形機器人落地的關鍵卡點之一。”中關村物聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟副秘書長袁帥告訴第一財經(jīng)記者,高質量數(shù)據(jù)語料的喂給,能夠加快機器人的自我學習速度。“當前主流的數(shù)據(jù)訓練方式主要是像特斯拉那樣真人采集數(shù)據(jù)訓練,或者是利用一些公開資料進行仿真數(shù)據(jù)合成訓練,也就是‘Sim2Real’(從仿真到真機的遷移)!

一位北京初創(chuàng)人形機器人企業(yè)的負責人向第一財經(jīng)記者透露,后者的成本會比前者少60%甚至更多,但訓練效果相差懸殊,“大部分情況下,我們還是需要用人類專家進行二次示范教學”。

英偉達研究中心的高級研究員Animesh Garg曾在采訪中提到,特斯拉的人形機器人Optimus 可能需要數(shù)百萬小時的數(shù)據(jù)才能完全準備好在特斯拉工廠工作,也就是至少5億美元的數(shù)據(jù)采集成本,“但即使這樣做,也無法保證成功”。

“機器人技術的發(fā)展要落后于其他AI技術,包括當前十分火熱的具身智能技術,關鍵的原因就是優(yōu)質數(shù)據(jù)集的缺失!备吖C器人產(chǎn)業(yè)研究所所長盧瀚宸告訴第一財經(jīng)記者,從具身智能機器人能力成長路徑來看,優(yōu)質數(shù)據(jù)集與基礎模型的相互增益構成了“數(shù)據(jù)飛輪”,即數(shù)據(jù)集的規(guī)模與質量將大大促進基礎模型的增益改善。

盧瀚宸認為,開源是一種思路,尤其在一個新興領域的發(fā)展初期,開源可以大大加快行業(yè)的發(fā)展和迭代速度,同時也可以增加產(chǎn)業(yè)鏈各類角色的參與。

不過,上述北京初創(chuàng)人形機器人企業(yè)負責人也向第一財經(jīng)記者指出,部分企業(yè)開源大多還是屬于產(chǎn)品銷售的配套服務,“比如在售賣機器人本體的時候進行配套的二次開發(fā)服務,相比基礎的機型,可能價格會上浮100%甚至更多”。

“如果數(shù)據(jù)足夠真實客觀,那對于行業(yè)來說無疑是一個具有推動意義的舉措!痹撈髽I(yè)負責人表示,開源非常有利于行業(yè)統(tǒng)一標準,減少重復無用功,但數(shù)據(jù)集的推動作用有多大,還需要在投入實際訓練后再進行判斷,“從性價比的角度來看,采用真實采集的數(shù)據(jù)集,相比于人工采集,訓練成本預計會降低50%左右”。

盧瀚宸也指出,隨著技術的持續(xù)發(fā)展,企業(yè)在開源和閉源的選擇上也在發(fā)生變化!盎谏虡I(yè)變現(xiàn)的考量,開源和閉源的邊界也開始變得模糊。”盧瀚宸說。

值得一提的是,智元機器人是上海市人工智能“模塑申城”實施方案的重要合作伙伴。上海市人民政府辦公廳印發(fā)的《關于人工智能“模塑申城”的實施方案》指出,到2025年底,建成世界級人工智能產(chǎn)業(yè)生態(tài),力爭全市智能算力規(guī)模突破100EFLOPS,形成50個左右具有顯著成效的行業(yè)開放語料庫示范應用成果,建設3-5個大模型創(chuàng)新加速孵化器,建成一批上下游協(xié)同的賦能中心和垂直模型訓練場。

(本文來自第一財經(jīng))

贊助本站

相關內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港