定焦One(dingjiaoone)原創(chuàng)
作者 | 王璐
編輯 | 魏佳
有這樣一款眼鏡,讓你無(wú)論身處英國(guó)、法國(guó)還是意大利,都不用擔(dān)心語(yǔ)言不通,它能將對(duì)方說(shuō)的任何語(yǔ)言實(shí)時(shí)翻譯成你熟悉的文字,甚至連你目之所及的廣告牌,也能直接將翻譯顯示在鏡片上。
不僅是貼身翻譯,它還能實(shí)時(shí)拍照、錄制視頻,再也不用擔(dān)心滑雪、騎馬、駕駛時(shí)不方便記錄;如果想聽(tīng)歌或者去某個(gè)地方,只需喊一聲“Hey XX”,便能喚起音樂(lè)、導(dǎo)航功能?傊謾C(jī)上的操作幾乎都能在這款眼鏡中實(shí)現(xiàn)。
而且它不笨重,外觀和墨鏡差不多,重量?jī)H比普通墨鏡多十克左右,售價(jià)在2000元上下。
這款黑科技便是國(guó)內(nèi)大廠都在搶著做的AI眼鏡。
這股風(fēng)從國(guó)外的Meta吹來(lái)。去年,Meta與百年眼鏡老店雷朋聯(lián)合推出了一款名叫「Ray-Ban Meta」的智能眼鏡(以下簡(jiǎn)稱(chēng)Meta眼鏡),今年4月又新增了AI功能,立刻受到追捧。據(jù)科技媒體The Verge統(tǒng)計(jì),截至2024年5月,這款智能眼鏡的全球銷(xiāo)量已突破100萬(wàn)副。此前,沒(méi)有任何一款智能眼鏡有過(guò)如此高的銷(xiāo)量。
這樣的爆款效應(yīng)讓很多人意識(shí)到,AI眼鏡或是現(xiàn)階段AI最佳的落地場(chǎng)景。
于是從今年4月底開(kāi)始,華為、百度等各大廠商陸續(xù)發(fā)布/發(fā)售了AI眼鏡,這股風(fēng)潮更是在11月到達(dá)了頂峰,有媒體統(tǒng)計(jì),最密集時(shí),國(guó)內(nèi)外僅10天就發(fā)布了18副AI眼鏡。
入局者中,既包括互聯(lián)網(wǎng)大廠(百度、字節(jié))、消費(fèi)電子企業(yè)(華為、小米、OPPO、TCL),還有AR類(lèi)智能硬件科技公司(Rokid、閃極科技、影目科技等),它們或多或少在自研大模型、硬件設(shè)備、銷(xiāo)售渠道等方面具備一到多個(gè)優(yōu)勢(shì),而且這些AR類(lèi)公司大多有大廠/消費(fèi)電子企業(yè)的投資或合作。
研究機(jī)構(gòu)wellsenn XR預(yù)測(cè),從2025年開(kāi)始,AI智能眼鏡將在傳統(tǒng)眼鏡銷(xiāo)量保持穩(wěn)定增長(zhǎng)的大背景下快速滲透,2029年,AI智能眼鏡年銷(xiāo)量有望達(dá)到5500萬(wàn)副,到2035年,有望達(dá)14億副。
如今的“百鏡大戰(zhàn)”,堪比去年的“百模大戰(zhàn)”,入局者還在不斷增多,做FA的王立表示,“AI眼鏡是投資機(jī)構(gòu)積極在看的少數(shù)熱門(mén)AI賽道!
但任何火熱的賽道都可能面臨一定的風(fēng)險(xiǎn),況且各家之前也給AI尋找過(guò)包含耳機(jī)在內(nèi)的多種硬件設(shè)備做為載體,都沒(méi)有到達(dá)預(yù)想效果,這次選擇難度更高的眼鏡,能成功嗎?
火熱的AI眼鏡:三類(lèi)公司,三種路線(xiàn)據(jù)「定焦One」梳理,目前入局AI眼鏡的公司可以分為三類(lèi),它們的產(chǎn)品及主要信息如下表:
注:僅統(tǒng)計(jì)確定發(fā)布日期的產(chǎn)品
在對(duì)比這些公司的產(chǎn)品之前,我們先簡(jiǎn)單科普一下,國(guó)內(nèi)AI眼鏡的基本功能包括語(yǔ)音識(shí)別、音視頻播放錄制和AI調(diào)用(比如語(yǔ)音交互、翻譯、查詢(xún)天氣交通信息)。綜合多位從業(yè)者的觀點(diǎn),廠商大部分都是圍繞著“音頻”、“攝像頭”、“AR顯示”三種要素進(jìn)行組合,價(jià)格在500元-5000元之間,功能越多,價(jià)格越高,具體可以主要分為三種路線(xiàn)。
第一種主打音頻,沒(méi)有攝像頭、功能較為單一,只能支持語(yǔ)音通話(huà)、聽(tīng)音樂(lè)等音頻功能,比如小米生態(tài)鏈企業(yè)蜂巢科技推出的界環(huán)AI音頻眼鏡、華為推出的華為智能眼鏡2等。由于無(wú)法支持拍照、錄像、視頻顯示,也有人將這類(lèi)AI眼鏡定義為音頻眼鏡。
最近,「定焦One」走訪(fǎng)了華為某門(mén)店,由于AI眼鏡行業(yè)的火熱,不少顧客對(duì)店內(nèi)在售的華為智能2眼鏡表示好奇,但得知它只能支持音頻功能時(shí),便沒(méi)了興趣。一名工作人員更是將這款眼鏡形容為“眼鏡款式的藍(lán)牙耳機(jī)”。
北京某商場(chǎng)展示的華為智能眼鏡2(共五款,價(jià)格在1699-2299元不等) 「定焦One」攝
第二種是音頻+攝像頭,在音頻的基礎(chǔ)上具備了拍照、錄像等視頻功能,今年大火的Meta眼鏡,以及百度的小度AI眼鏡就是走的這個(gè)路線(xiàn)。
第三種是音頻+攝像頭+AR(增強(qiáng)現(xiàn)實(shí)),不僅支持音視頻,還具備增強(qiáng)現(xiàn)實(shí)功能,例如,用戶(hù)在拍完照后,可直接在眼鏡上看預(yù)覽,AR眼鏡公司Rokid推出的Rokid Glasses屬于這類(lèi)。
我們?cè)倥e個(gè)例子區(qū)別第二種和第三種,比如你在國(guó)外看到了一個(gè)外文廣告牌,搭載AR顯示的AI眼鏡可通過(guò)攝像頭拍照識(shí)別廣告牌內(nèi)容,并翻譯成中文顯示在眼鏡上,而沒(méi)有AR顯示的AI眼鏡,只能將翻譯結(jié)果通過(guò)音頻輸出或者支持用戶(hù)在手機(jī)上查看。
另外,這三種路線(xiàn)的產(chǎn)品都能夠調(diào)用AI實(shí)現(xiàn)互動(dòng),也都能搭載大模型,有些是靠自研,有些是采用第三方合作伙伴的技術(shù)。
從技術(shù)難度上來(lái)說(shuō),第一種比較低,國(guó)內(nèi)的AI音頻眼鏡已經(jīng)推出了一段時(shí)間,也有了面向市場(chǎng)的代表性產(chǎn)品,第二種和第三種對(duì)技術(shù)的要求更高。具體來(lái)說(shuō),第一種主要依賴(lài)語(yǔ)音和TTS(文本轉(zhuǎn)語(yǔ)音)交互,后兩者是圖像交互,在語(yǔ)音、TTS的基礎(chǔ)上還加入了顯示,且顯示的使用率更高,而帶AR顯示的,還需要具備增強(qiáng)現(xiàn)實(shí)技術(shù)。也因此,絕大多數(shù)這類(lèi)型的AI眼鏡還處在研發(fā)或者“發(fā)布不發(fā)售”狀態(tài)。
相應(yīng)的,在硬件成本上,也是第一種比較低,只需要在鏡框里加上麥克風(fēng)陣列、耳機(jī)、電池和處理器等,第二種需要加上攝像頭,搭載AR的第三種還需要光學(xué)模塊。配件多了的同時(shí),還需要解決更高的功耗和散熱問(wèn)題。
目前入局的互聯(lián)網(wǎng)大廠、消費(fèi)電子企業(yè)、AR公司,主要發(fā)力的是后兩種,它們做AI眼鏡的目的也不太一樣。
從業(yè)者小明告訴「定焦One」,百度、字節(jié)這些互聯(lián)網(wǎng)大廠,目前做的是第二種,更多是想通過(guò)AI眼鏡跑自己的大模型,而非主要靠賣(mài)硬件,相比消費(fèi)電子企業(yè)和AR類(lèi)公司,它們?cè)谟布弦膊痪邆涓?jìng)爭(zhēng)優(yōu)勢(shì)。AR類(lèi)公司之前也做眼鏡,現(xiàn)在是想通過(guò)與AI結(jié)合,找到更多業(yè)務(wù)增量。至于小米這類(lèi)消費(fèi)電子企業(yè),在產(chǎn)品上跟風(fēng)Meta,并通過(guò)供應(yīng)鏈優(yōu)勢(shì)壓低價(jià)格,特別是小米在智能家居和物聯(lián)網(wǎng)上還具備優(yōu)勢(shì),做AI眼鏡有一定想象空間。
期待中的AI眼鏡,和現(xiàn)實(shí)中的AI眼鏡目前,各家在音視頻功能上已經(jīng)做得比較完善。
比如在語(yǔ)音喚醒和交互功能上,用戶(hù)可以用聲音輕松喚出“XX同學(xué)”等進(jìn)行對(duì)話(huà),或是進(jìn)行音樂(lè)播放、天氣播報(bào)、信息推送。
各大廠商還將導(dǎo)航、翻譯、提詞器、速記整理等各種細(xì)化功能接入到AI眼鏡上,實(shí)現(xiàn)讓用戶(hù)不用費(fèi)勁在手機(jī)里挨個(gè)打開(kāi),只需要簡(jiǎn)單發(fā)出語(yǔ)音指令便能輕松完成。
視頻方面,也能實(shí)現(xiàn)比較高的拍攝錄像質(zhì)量。
比如Meta智能眼鏡搭載了1200萬(wàn)像素的超廣角攝像頭(和iPhone11、12差不多),最長(zhǎng)錄制時(shí)間三分鐘,國(guó)內(nèi)直接在這方面卷了起來(lái),小度AI眼鏡配備了1600萬(wàn)像素的超廣角攝像頭,Rokid Glasses在攝影時(shí)長(zhǎng)上能達(dá)到40分鐘,幾家都具備防抖功能。
現(xiàn)階段,各家企業(yè)真正在比拼的,集中在三點(diǎn)。
首先是重量,要先解決用戶(hù)佩戴舒適度的問(wèn)題。普通眼鏡的重量在三四十克,在此前已經(jīng)面市的VR、AR、MR眼鏡中,即便是相對(duì)較輕的AR眼鏡,大部分也在100g以?xún)?nèi),難以長(zhǎng)時(shí)間佩戴,也影響著產(chǎn)品的普及。
因此,這一批AI眼鏡廠商非常重視造型設(shè)計(jì)與舒適度,即在保持一定續(xù)航能力的前提下,將AI眼鏡做到輕量化和小型化。
由于AI眼鏡要加入芯片、主板、電池等元器件,目前大多數(shù)AI智能眼鏡的重量在五十克左右,為了讓AI眼鏡的重量無(wú)限趨近于普通眼鏡,廠商想出了各種方法。
比如魅族推出的StarVAir2采用了超小體積的單綠光引擎,體積縮小50%,重量減輕50%,Rokid將左右鏡片上各安裝一個(gè)光機(jī)的雙光機(jī)方案,精簡(jiǎn)為鼻梁中間單光機(jī)雙鏡片顯示方案,進(jìn)一步降低重量。
圖源 / 星紀(jì)魅族科技微博
其次是智能體驗(yàn),AI眼鏡最大的噱頭莫過(guò)于AI。
用戶(hù)對(duì)AI眼鏡的期待是,希望它能超過(guò)手機(jī),像人體感官一樣完美捕捉視覺(jué)、聲音、位置等信息,從而提供貼心智能服務(wù),但目前AI眼鏡和大模型的結(jié)合程度,還達(dá)不到完全智能化的水平,導(dǎo)致其能實(shí)現(xiàn)的功能都比較基礎(chǔ),例如語(yǔ)音助手、實(shí)時(shí)翻譯、導(dǎo)航提醒、物體識(shí)別等,甚至在捕捉信息的靈敏度和準(zhǔn)確度等方面,都還有很大提升空間。
即便是被大家認(rèn)可的Meta眼鏡也存在很多bug,比如在聲音上,Meta眼鏡內(nèi)置了5個(gè)麥克風(fēng)陣列系統(tǒng),揚(yáng)聲器也調(diào)大了音量,但在嘈雜環(huán)境中還是會(huì)受到影響;面對(duì)較為復(fù)雜的內(nèi)容回復(fù),其也不會(huì)直接念出來(lái),而是提示用戶(hù)在手機(jī)上查看。所以一些用戶(hù)對(duì)Meta眼鏡的主要定位是,充當(dāng)耳機(jī)、相機(jī)、備忘錄,使用場(chǎng)景有限。
而且“和國(guó)外相比,國(guó)內(nèi)大模型和國(guó)外的GPT-4o還存在一定差距,信息檢索能力和反饋速度等方面都存在不同程度的短板,大多數(shù)AI眼鏡還沒(méi)能達(dá)到讓消費(fèi)者買(mǎi)單的程度!毙∶鞅硎尽
最為關(guān)鍵的一點(diǎn)是,目前AI眼鏡還不能脫離手機(jī)使用。
小明告訴「定焦One」,AI眼鏡本質(zhì)上是硬件部分+大模型,用戶(hù)通過(guò)眼鏡識(shí)別到圖像或語(yǔ)音信息,然后通過(guò)Bluetooth、Wifi等傳遞給手機(jī)扔到云端處理,再反饋到眼鏡上,國(guó)內(nèi)AI眼鏡本身里面跑的是Linux系統(tǒng),而非智能安卓,AI功能的實(shí)現(xiàn)需要借助手機(jī)。
換句話(huà)說(shuō),如果手機(jī)不在身旁,AI眼鏡便不具備高度智能化。
續(xù)航也是用戶(hù)擔(dān)心的一大問(wèn)題。
目前,Meta眼鏡只支持三分鐘的視頻錄制,有用戶(hù)表示,如果重復(fù)啟動(dòng)連續(xù)拍攝視頻,電量最多只能支撐半小時(shí),即便不錄制視頻,電量也撐不過(guò)半天,這離設(shè)想中的長(zhǎng)時(shí)間佩戴還存在差距。
不過(guò)很多國(guó)內(nèi)廠商似乎已經(jīng)找到了解決方案,Rokid Glasses官方表示,在明年發(fā)售時(shí),續(xù)航能達(dá)到4個(gè)小時(shí),并配有充電眼鏡盒,20分鐘充滿(mǎn)電。小度AI眼鏡也宣稱(chēng)能連續(xù)聽(tīng)歌或打電話(huà)5小時(shí)以上。但這些,都還要等到產(chǎn)品正式發(fā)售后才能見(jiàn)分曉。
AI眼鏡真正爆發(fā),還需要耐心盡管現(xiàn)實(shí)中的AI眼鏡離想象中的差距不小,但并不影響從業(yè)者和投資人的熱情,他們認(rèn)為,明年會(huì)出現(xiàn)“百鏡大戰(zhàn)”。
綜合從業(yè)者、投資人的說(shuō)法,大家看好AI眼鏡,主要在于三方面。
王立看好的是眼鏡本身具備的入口優(yōu)勢(shì)。
他解釋?zhuān)F(xiàn)在用戶(hù)最主要的消費(fèi)電子產(chǎn)品是手機(jī),而AI 眼鏡被認(rèn)為是最有可能切割手機(jī)10%-20%使用時(shí)長(zhǎng)和功能,并能與虛擬世界產(chǎn)生交互的終端形態(tài),能安裝麥克風(fēng)、揚(yáng)聲器、攝像頭、WiFi/藍(lán)牙模塊等硬件,從而進(jìn)行音頻識(shí)別、視頻拍攝、無(wú)線(xiàn)通訊、翻譯、導(dǎo)航等功能,而且通過(guò)視覺(jué)進(jìn)行AI問(wèn)答、物體識(shí)別,效率和精確性也高于純語(yǔ)音。
“目前,AI眼鏡是AI所有硬件產(chǎn)品里天花板最高的賽道,也是投資機(jī)構(gòu)積極在看的少數(shù)AI熱門(mén)賽道!蓖趿⒈硎尽
國(guó)外已有成功的AI眼鏡案例,也給了大家很大信心。
在交流中,不止一位從業(yè)者提到了Meta眼鏡的高銷(xiāo)量。國(guó)金證券曾估算,2024年Meta眼鏡出貨量或達(dá)200萬(wàn)臺(tái),而且考慮到目前AI功能僅限美國(guó)和加拿大用戶(hù)使用,若未來(lái)區(qū)域、語(yǔ)言推廣至全球,對(duì)應(yīng)銷(xiāo)量或超600萬(wàn)臺(tái)。
王立認(rèn)為,Meta眼鏡的銷(xiāo)量已經(jīng)證明了用戶(hù)對(duì)這一賽道存在需求,相比其他AI硬件,AI眼鏡跑通了從0到1。
AI眼鏡硬件供應(yīng)鏈完善,智能體趨于成熟,也是它被看好的重要原因。
從業(yè)者黃先生告訴「定焦One」,拿比較復(fù)雜的音攝顯(音頻+攝像頭+AR)組合的AI眼鏡來(lái)說(shuō),其涉及的比較重要的光機(jī)技術(shù),供應(yīng)鏈已逐漸完善,達(dá)到了商業(yè)化程度,應(yīng)用端也迎來(lái)了智能體的爆發(fā)。這一方面降低了成本,AI+AR眼鏡的售價(jià)大多能控制在2500元左右,另一方面也有了豐富的應(yīng)用供給,能實(shí)現(xiàn)各類(lèi)功能。
圖源 / LAWK李未可微博
不過(guò),AI眼鏡目前還處于早期,國(guó)內(nèi)還沒(méi)有爆款誕生,行業(yè)也存在著一些不確定因素。
首先是市場(chǎng)競(jìng)爭(zhēng)激烈,但產(chǎn)品差異化不明顯。
不止一位從業(yè)者表示,即便各家分屬于不同領(lǐng)域,但對(duì)AI眼鏡的認(rèn)知上沒(méi)有太大差距,都是在模仿Meta,而且參與競(jìng)爭(zhēng)的廠商越多,容錯(cuò)率越低。
王立表示,投資人在選擇一家AI眼鏡公司時(shí),更關(guān)注能不能做出差異化產(chǎn)品,具體看團(tuán)隊(duì)對(duì)用戶(hù)的理解度和技術(shù)能力,比如是否了解消費(fèi)者對(duì)AI眼鏡的功能需求、價(jià)格接受區(qū)間、眼鏡外觀等,以及團(tuán)隊(duì)是否具備這些需求的研發(fā)能力。此外渠道也很重要,Meta眼鏡能成功的一個(gè)重要原因是選擇與雷朋合作,其生產(chǎn)供應(yīng)渠道非常完善。
其次,攝像頭既是AI眼鏡重要的一環(huán),也是困擾著從業(yè)者的敏感點(diǎn)。
為了更加了解用戶(hù)對(duì)AI眼鏡的需求,有部分從業(yè)者在做用戶(hù)調(diào)查發(fā)現(xiàn),攝像頭功能可能會(huì)侵犯?jìng)(gè)人隱私,降低大家對(duì)AI眼鏡的接受度。
“在日常聚會(huì)或工作會(huì)談中,如果對(duì)方一直帶著一副有攝像頭的眼鏡,就像架了一臺(tái)攝像機(jī),大多數(shù)用戶(hù)都會(huì)覺(jué)得別扭,產(chǎn)生戒備心,害怕被拍攝或者錄下來(lái)!睆臉I(yè)者程成表示。
為了解決這一問(wèn)題,Meta 想到的解決辦法是,加了一個(gè)顯示提醒,當(dāng)攝像頭開(kāi)啟時(shí),眼鏡會(huì)亮燈,但程成表示,在實(shí)際操作時(shí),用戶(hù)可以通過(guò)很多物理和技術(shù)手段將這一提示關(guān)掉。
總結(jié)來(lái)看,AI眼鏡雖然入局者眾多,Meta眼鏡的銷(xiāo)量也證明了市場(chǎng)接受度,但這個(gè)行業(yè)真正爆發(fā)還需要時(shí)間。究竟誰(shuí)能夠復(fù)制Meta的成功,要等到明年產(chǎn)品大規(guī)模上市后才能揭曉。
*題圖來(lái)源于Rokid官網(wǎng)。應(yīng)受訪(fǎng)者要求,文中王立、小明、程成為化名。