《科創(chuàng)板日報》3月11日訊(編輯 宋子喬) 智元機(jī)器人創(chuàng)始人、華為天才少年彭志輝(稚暉君)的B站賬號更新了,視頻中,彭志輝稱,“這應(yīng)該是我鴿了2年之后,第一次正兒八經(jīng)的更新視頻!
上一次彭志輝在B站真正意義上的更新,還是2023年4月1日。
此次,彭志輝親自上陣,介紹了智元最新研發(fā)的通用人形機(jī)器人原型機(jī)靈犀X2。
靈犀X2由智元旗下的機(jī)器人實(shí)驗(yàn)室X-Lab開發(fā),全身共28個自由度、體重33.8千克,小腦控制器、域控制器、智能電源管理系統(tǒng)、核心關(guān)節(jié)模組全線自研。
視頻著重介紹了這款機(jī)器人的關(guān)節(jié)、仿生足弓、靈巧手,以及散熱、續(xù)航能力,該機(jī)器人采用柔性材料,可與手機(jī)聯(lián)動(見下圖:手機(jī)插入機(jī)器人大腦)。
運(yùn)動、交互、作業(yè)是這款機(jī)器人的三個核心功能。
靈犀X2不僅可以像人一樣自然走路,也能跑、能轉(zhuǎn)、能跳點(diǎn)小舞,會滑板車、玩平衡車、騎自行車。
該機(jī)器人搭載情感計算引擎。彭志輝稱,靈犀X2搭載了多模態(tài)交互大模型“硅光動語”,因此它是第一臺真正具備復(fù)雜交互能力的“靈動機(jī)器人”,具備毫秒級交互反應(yīng),以及通過視覺理解和認(rèn)知世界的能力。
為“失眠”的稚暉君推薦了牛奶(給了咖啡和牛奶兩個實(shí)物讓其選擇)
為了更好地實(shí)現(xiàn)人機(jī)交互,靈犀X2可進(jìn)行遠(yuǎn)程裸眼3D交流。
為了讓靈犀X2更有“人味兒”,智元團(tuán)隊(duì)增添了不少細(xì)節(jié),比如靈犀X2可模仿人類呼吸韻律、具備人類好奇心和注意力機(jī)制、會一些小動作等肢體語言。
不過,靈犀X2在泛化智能作業(yè)上的表現(xiàn)稍微遜色。視頻中,該機(jī)器人只能進(jìn)行簡單作業(yè),不具備復(fù)雜作業(yè)的能力。據(jù)介紹,其可以裝配包括靈巧手在內(nèi)的各種末端,初步具備了簡單任務(wù)中對操作物體的零樣本泛化能力,并可以在某些任務(wù)中多機(jī)協(xié)作。
總體而言,靈犀X2的運(yùn)動和交互能力比前輩X1有了很大的進(jìn)步,但距離真實(shí)可用的通用機(jī)器人,還有很大的進(jìn)步空間。
智元機(jī)器人的最終目標(biāo)是制造通用人形機(jī)器人。2024年該公司發(fā)布遠(yuǎn)征系列機(jī)器人并實(shí)現(xiàn)初步量產(chǎn);半年前成立X-Lab,完全開源的靈犀X1原型機(jī)上線。
3月10日,智元機(jī)器人正式發(fā)布全球首個通用具身基座大模型智元啟元大模型(Genie Operator-1,簡稱GO-1)。GO-1是一個被智元機(jī)器人稱作機(jī)器人“老師”般的存在,給機(jī)器人提供“基礎(chǔ)教育”和“職業(yè)教育”,它的特色在于,提出了Vision-Language-Latent-Action (ViLLA) 框架,該框架由VLM(多模態(tài)大模型) + MoE(混合專家)組成,將采訓(xùn)推一體,小樣本快速泛化、“一腦多形”的跨本體應(yīng)用、持續(xù)進(jìn)化、人類視頻學(xué)習(xí)等于一身。
智元機(jī)器人表示,GO-1大模型將加速具身智能的普及,機(jī)器人將從依賴特定任務(wù)的工具,向著具備通用智能的自主體發(fā)展。
(科創(chuàng)板日報 宋子喬)