一款極其靈動(dòng)的 AI 臺(tái)燈機(jī)器人,火了。
盡管這兩年不斷見證了真實(shí)世界的機(jī)器人刷新我們的認(rèn)知,從奔跑、翻滾到跳舞,也看過了米家皮皮燈,但還是第一次看到這么靈動(dòng)的臺(tái)燈,很像皮克斯片頭跳動(dòng)的 Luxo Jr.(小臺(tái)燈)。
圖/蘋果
而這個(gè)臺(tái)燈,是蘋果公司機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)做的非人形機(jī)器人。
蘋果要做家用機(jī)器人的消息,其實(shí)已經(jīng)傳了相當(dāng)一段時(shí)間,但官方實(shí)際上一直沒有承認(rèn),也沒有透露產(chǎn)品細(xì)節(jié)。不過,蘋果機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)近期直接在官網(wǎng)公布了一篇研究論文以及一段實(shí)拍演示視頻,全面展示了這款 AI 臺(tái)燈機(jī)器人的交互能力和表現(xiàn),也在 X、Reddit 等社交平臺(tái)上被各種圍觀討論。
乍看之下,這款蘋果「臺(tái)燈」的外觀并不奇特,硬要說也就是比常規(guī)臺(tái)燈全身上下多了不少機(jī)電結(jié)構(gòu)。但關(guān)鍵是動(dòng)起來,它不僅能讓燈光主動(dòng)跟隨書本,用戶還能通過簡單地觸摸、手勢來召喚或者指引它。
圖/蘋果
不僅如此,蘋果「臺(tái)燈」還能通過流暢、精細(xì)的動(dòng)作傳達(dá)出微妙的性格與情緒,比如被拒絕后的委屈,被召喚時(shí)的點(diǎn)頭哈腰,又或者是觀察一個(gè)物體時(shí)的好奇心。
而且從演示來看,不只是提供情緒價(jià)值。蘋果的「臺(tái)燈」除了支持語音和手勢交互,同時(shí)還能通過攝像頭進(jìn)行視覺觀察,以及透過投影顯示內(nèi)容,就比如做作業(yè)時(shí)遇到不懂可以讓它給出解題思路。
圖/蘋果
盡管這還只是一個(gè)原型產(chǎn)品,但也足以讓我們一窺蘋果對于家用機(jī)器人的想法和思考。
蘋果 AI 臺(tái)燈:智能,但不止于實(shí)用
坦白講,整個(gè)演示視頻看下來,蘋果機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)開發(fā)的這款臺(tái)燈機(jī)器人,對小雷來說最亮眼的還是智能程度和交互表現(xiàn)。
演示中的一幕是,蘋果「臺(tái)燈」不僅能提醒研究人員喝水,還會(huì)直接主動(dòng)用頭部將水杯推向她:
圖/蘋果
一方面,類似主動(dòng)提醒用戶的想法其實(shí)早已有之,不管是手機(jī)、PC 上的各種軟件,還是雷科技年前報(bào)道過的 ChatGPT Tasks 功能,但這些做法只停留在數(shù)字世界,做不到在物理世界的主動(dòng)提醒。
另一方面,AI 臺(tái)燈機(jī)器人的想法也不稀奇。米家的皮皮燈也引起過大家的激烈討論,但最后基本被認(rèn)定為一個(gè)可動(dòng)性、可玩性都不太高的玩具。字節(jié)跳動(dòng)也嘗試過這個(gè)方向,推出過大力智能作業(yè)燈,也是將 AI 集成進(jìn)臺(tái)燈的概念,但交互上基本停留在軟件上。
米家皮皮燈,圖/小米
而蘋果「臺(tái)燈」上,我們能看到詢問天氣時(shí)不僅是語音播報(bào)天氣,還會(huì)轉(zhuǎn)向戶外,透過攝像頭的 AI 視覺能力結(jié)合當(dāng)前現(xiàn)實(shí)空間看到的天氣。有意思的是,當(dāng)研究人員告訴它不能帶它去徒步時(shí),「臺(tái)燈」也會(huì)低下頭扭捏,傳達(dá)出悲傷又委屈的情緒。
圖/蘋果
當(dāng)你正在進(jìn)行手工作業(yè)或者任何桌面上的研究時(shí),也能讓「臺(tái)燈」時(shí)刻并提供建議,甚至是把需要內(nèi)容直接投影出來;晚上看完書后,「臺(tái)燈」在識別沒有其他活動(dòng)后也會(huì)自動(dòng)關(guān)閉燈光。
甚至當(dāng)它伸長身體也無法完成任務(wù)時(shí),也是會(huì)在盡力嘗試后「委屈地」告訴你做不到。看到這樣,你還能抱怨它嗎?屬實(shí)是情緒價(jià)值拉滿。
圖/蘋果
一言以蔽之,實(shí)用價(jià)值要有,情緒價(jià)值也要有。而這,也能從蘋果團(tuán)隊(duì)的字里行間中清晰地看到:
「為了使機(jī)器人與人類更自然地互動(dòng),機(jī)器人的運(yùn)動(dòng)設(shè)計(jì)也應(yīng)同樣整合表達(dá)性品質(zhì)如意圖、注意力和情感以及傳統(tǒng)的功能性考慮,如任務(wù)完成、空間限制和時(shí)間效率!
臺(tái)燈變身機(jī)器人:不只是萌,不只是接入AI
事實(shí)上,盡管從對話和智能程度來看,大概率可以判斷出蘋果機(jī)器學(xué)習(xí)研究團(tuán)隊(duì)是基于大模型開發(fā)出了這款臺(tái)燈形態(tài)的 AI 機(jī)器人。但就蘋果公布的這篇論文而言,并非聚焦在人工智能的層面,反而是聚焦在「臺(tái)燈」一系列精細(xì)、靈動(dòng)的運(yùn)動(dòng)上。
首先蘋果論文的標(biāo)題就是《ELEGNT: Expressive and Functional Movement Design for Non-anthropomorphic Robot》(優(yōu)雅:非人形機(jī)器人的表現(xiàn)性和功能性運(yùn)動(dòng)設(shè)計(jì)),四位論文作者中有三位是華人。
論文也透露了,臺(tái)燈形態(tài)的靈感確實(shí)直接來源于皮克斯的經(jīng)典角色 Luxo Jr.(小臺(tái)燈) ,而蘋果也針對臺(tái)燈形態(tài)的非人形機(jī)器人設(shè)計(jì)出了一套框架,專注于通過一系列流暢且富有表現(xiàn)力的動(dòng)作,在日常互動(dòng)中實(shí)現(xiàn)情感表達(dá)和實(shí)用功能的結(jié)合。
簡單來說,為了避免生硬的機(jī)器人運(yùn)動(dòng)/動(dòng)作影響人類與機(jī)器人之間更自然地交互體驗(yàn),蘋果團(tuán)隊(duì)開發(fā)出了這一套基于深度學(xué)習(xí)的運(yùn)動(dòng)設(shè)計(jì)框架,來讓非人形機(jī)器人兼具表現(xiàn)力和功能性。
圖/蘋果
研究團(tuán)隊(duì)也確實(shí)招募了 21 名參與者,在 6 種不同場景下觀看人類與機(jī)器人之間的交互。
結(jié)果顯示,比起單純滿足功能性要求的運(yùn)動(dòng)設(shè)計(jì),兼具表現(xiàn)力和功能性的運(yùn)動(dòng)設(shè)計(jì)明顯能提高參與者的評分用戶更喜歡也能接受 ,而且男性比女性更明顯,普通用戶比專業(yè)用戶更明顯。
其實(shí)從常理也能看到,米家皮皮燈推出之初之所以能夠引起廣泛關(guān)注和討論,并不在于功能性或者實(shí)用價(jià)值。但另一方面,蘋果這款 AI 臺(tái)燈的原型版最大的亮點(diǎn)就是同時(shí)具備情緒和實(shí)用價(jià)值,而不只是「萌」。
圖/蘋果
蘋果很大程度上也是基于大模型的能力,自然語言對話自不必說,從視覺能力上也能得以窺見一二。與此同時(shí),在人形機(jī)器人還很難短期內(nèi)落地家庭場景的背景下,這可能也是家用機(jī)器人的必然,即基于多模態(tài)大模型成為人類的「第三只眼」「第二大腦」。
此外,這款「臺(tái)燈」也讓我們初步看到了蘋果在人機(jī)交互上的想法,比如除了 AI 語音交互,還能看到基于攝像頭的 AI 視覺+圖形界面顯示,以及簡單的手勢和觸摸交互。尤其是視覺+顯示的交互能力,直接賦予了「臺(tái)燈」在各種場景下滿足的需求。
從這個(gè)角度看,我們完全可以期待蘋果未來最終推出的桌面機(jī)器人,在語音之外也支持視覺和顯示的能力,在擁有基于 AI 的實(shí)用價(jià)值的同時(shí),也能滿足人類用戶的情緒價(jià)值。
距離通用機(jī)器人,我們還有很遠(yuǎn)的路要走
1977 年,喬治盧卡斯帶著《星球大戰(zhàn)》一炮而紅,也帶火了其中的 R2-D2 機(jī)器人,這也讓全球的觀眾第一次對機(jī)器人有了具體的印象。馬斯克在去年秋天的 We, Robot 活動(dòng)中介紹特斯拉 Optimus 時(shí),也說:
Optimus 將是每個(gè)人自己的 R2-D2。
在大模型技術(shù)日新月異的今天,具身智能的機(jī)器人事實(shí)上已經(jīng)成為了一種共識,然而優(yōu)先發(fā)展人形機(jī)器人,還是非人形機(jī)器人仍然存在巨大的爭議。
但有一點(diǎn)是明確的,包括芯片廠商地瓜機(jī)器人(從地平線獨(dú)立出來的機(jī)器人部門)、人形機(jī)器人廠商智元機(jī)器人都表明過,通用的人形機(jī)器人距離實(shí)際走進(jìn)我們的生活都還有很長的一段路要走。
相比之下,非人形的家用機(jī)器人,在大模型技術(shù)的快速迭代下或許將更早走進(jìn)我們的生活,成為人類的第一波機(jī)器人浪潮。