展會(huì)信息港展會(huì)大全

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-09-10 14:28:07   瀏覽:2839次  

導(dǎo)讀:本次發(fā)布會(huì)展示了蘋果的最新科技成果,特別是在智能交互和AI應(yīng)用方面的巨大突破,跟著小編的步伐一起了解整個(gè)發(fā)布會(huì)的三大重點(diǎn)吧。 發(fā)布會(huì)先是講了蘋果手表和耳機(jī)。 耳機(jī)產(chǎn)品中有兩個(gè)點(diǎn)讓作者比較驚喜,其中一個(gè)是AirPods4支持通過點(diǎn)頭和搖頭來對(duì)一些通知進(jìn)...

本次發(fā)布會(huì)展示了蘋果的最新科技成果,特別是在智能交互和AI應(yīng)用方面的巨大突破,跟著小編的步伐一起了解整個(gè)發(fā)布會(huì)的三大重點(diǎn)吧。

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

發(fā)布會(huì)先是講了蘋果手表和耳機(jī)。

耳機(jī)產(chǎn)品中有兩個(gè)點(diǎn)讓作者比較驚喜,其中一個(gè)是AirPods4支持通過點(diǎn)頭和搖頭來對(duì)一些通知進(jìn)行控制。

當(dāng)用戶在雙手拿著東西的時(shí)候突然來電話了,這個(gè)時(shí)候就可以通過點(diǎn)頭來接聽電話,或是通過搖頭來拒接電話。

第二個(gè)點(diǎn)是耳機(jī)能夠識(shí)別用戶說話的聲音。當(dāng)用戶戴著耳機(jī)聽音樂突然遇到了熟人。開始和熟人打招呼,這個(gè)時(shí)候耳機(jī)的音量就會(huì)自動(dòng)降低,直到用戶和他的朋友結(jié)束這一次對(duì)話。耳機(jī)的音量會(huì)自動(dòng)恢復(fù)。

這兩個(gè)場景都可以算是比較典型的痛點(diǎn)。蘋果也通過新技術(shù)解決了這兩個(gè)問題。其實(shí)整個(gè)發(fā)布會(huì)看下來,我們會(huì)發(fā)現(xiàn)蘋果很少說AI這個(gè)詞,一般會(huì)用機(jī)器學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)等等來替代,其描述還是更準(zhǔn)確一些。

講完了耳機(jī)之后就開始了整個(gè)發(fā)布會(huì)最重要的部分,開始講iPhone了。用一句話來形容iPhone和AI的關(guān)系庫克是這樣說的:“iphone16是為Apple Intelligence而設(shè)計(jì)的”?梢夾I技術(shù)的應(yīng)用場景在新一代iPhone16中有多么被重視。

作為AI能力的基礎(chǔ)保障iPhone16的CPU升級(jí)到了18處理器,相對(duì)于上一代iPhone15的處理器跨越了兩代。這一點(diǎn)非常驚喜,具體的性能對(duì)比見下圖。

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

不只是CPU方面有明顯的性能提升,在GPU方面提升也非常巨大,相對(duì)于iPhone15提升達(dá)到了40%。

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

硬件性能的提升為iOS系統(tǒng)的各個(gè)AI技術(shù)的應(yīng)用場景提供了優(yōu)秀的保障,下面就來iphopne16的三大重點(diǎn)改變。

一、iPhone16增加了一個(gè)實(shí)體按鈕

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

這個(gè)實(shí)體按鈕可以被設(shè)置成不同的功能。例如可以點(diǎn)擊直接開啟錄音或者是翻譯。還可以是某些APP里面某個(gè)具體的功能。

這種按鈕其實(shí)在國產(chǎn)手機(jī)努比亞Z60ultra里也有相同的設(shè)計(jì),但是能夠自定義的能力范圍和蘋果相比還有一些差距。

這種差距對(duì)用戶體驗(yàn)的影響還是比較大的,例如走路時(shí)走著走著突然想到了一個(gè)靈感,這個(gè)時(shí)候點(diǎn)擊一次就能開始錄音記錄和點(diǎn)擊兩三次區(qū)別非常大。

這個(gè)按鈕的核心意義就是進(jìn)一步縮短用戶與手機(jī)中各種服務(wù)的距離。這個(gè)設(shè)計(jì)目標(biāo)其實(shí)幾乎已經(jīng)成為了各個(gè)手機(jī)廠商的共識(shí)。像近幾年出現(xiàn)的息屏顯示就是為了幫助用戶在手機(jī)完全沒有解鎖沒有點(diǎn)亮的狀態(tài)下能夠看到一些服務(wù)相關(guān)的信息。

包括鎖屏上可以進(jìn)行的通知可以放置的。應(yīng)用小部件都是基于同樣的目標(biāo)產(chǎn)生的設(shè)計(jì)方案。國產(chǎn)手機(jī)廠商中OPPO曾經(jīng)做了一些服務(wù)原子化的能力,也是基于這個(gè)目標(biāo)。

除此之外,iPhone16還展示了其他幾種AI能力的具體應(yīng)用。但實(shí)際上這些能力都沒有超出我們已經(jīng)看到過的AI產(chǎn)品的能力。具體如下:

1、文字寫作能力

例如在郵件中可以基于用戶寫的內(nèi)容進(jìn)行改寫,使內(nèi)容更加適合對(duì)話場景,例如更適合工作場景的語氣和措辭。

這個(gè)能力不僅限于在蘋果自家的應(yīng)用中使用,按照發(fā)布會(huì)中的介紹,這個(gè)能力幾乎可以在任何第三方應(yīng)用中使用是一個(gè)系統(tǒng)級(jí)的能力。

2、文字理解能力

這個(gè)能力主要會(huì)應(yīng)用在一些提醒的場景中。例如在手機(jī)的通知中心以前我們只能根據(jù)通知的時(shí)間來進(jìn)行排序,但是時(shí)間并不能代表這條通知是否重要。甚至?xí)捎谕ㄖ呐判。完全依照時(shí)間而導(dǎo)致我們錯(cuò)過一些重要的信息。

而有了文字理解能力之后,系統(tǒng)就會(huì)去理解通知中包含的具體信息。例如可能可以識(shí)別廣告信息,把這些理解為不重要的信息,可能會(huì)識(shí)別某個(gè)聯(lián)系人發(fā)過來的內(nèi)容,標(biāo)記為一條重要的信息。

這樣就可以按照重要程度,至少可以按照重要和不重要兩類來對(duì)通知進(jìn)行區(qū)分,幫助用戶獲取更重要的內(nèi)容。

除了通知的場景,在郵件的場景這個(gè)能力也很重要。傳統(tǒng)的郵件除了標(biāo)題之外,我們往往只能看到開頭的一兩行文字,而這一兩行文字往往又是一些無意義的文字。

下面這張圖片是作者郵箱中一封真實(shí)的郵件。他的本意是想提醒我。有一款我感興趣的游戲正在打折。引導(dǎo)用戶去購買。

但實(shí)際上在我沒有查看詳情之前,甚至無法知道具體是哪一款游戲正在打折。而恰恰是這個(gè)最重要的信息是無法被識(shí)別到的。

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

而有了文字理解能力之后就可以對(duì)郵件的內(nèi)容形成摘要例如把上面那張圖片中的信息寫為艾爾登法環(huán)正在打9折,這樣就比現(xiàn)有的信息有效很多。

下面這張圖是蘋果發(fā)布會(huì)中的截圖:

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

3、圖/視頻理解能力

手機(jī)操作系統(tǒng)中對(duì)于圖片和視頻的理解能力主要會(huì)被應(yīng)用在相冊(cè)應(yīng)用的搜索功能上。這個(gè)能力其實(shí)已經(jīng)并不新鮮了,我們?cè)谛∶资謾C(jī)中就可通過搜索圖片中包含的內(nèi)容來找到一張圖片。

而蘋果發(fā)布會(huì)展示的這項(xiàng)能力,好像在搜索條件的復(fù)雜程度上有一些突破。因?yàn)橐宰髡邔?shí)際的經(jīng)歷來看,在小米中我只搜索過單個(gè)的物體,例如某個(gè)圖片中包含翅膀。

而蘋果發(fā)布會(huì)中演示的可以是一個(gè)帶有描述詞的長句子。這一能力具體的范圍可能還需要拿到真機(jī)之后才能確定。

4、圖/視頻生成能力

除搜索圖片之外,在使用已有的圖片生成視頻時(shí),這一能力也很重要。其實(shí)就是找到很多有關(guān)系的圖片制作成一個(gè)影集視頻的功能。

對(duì)于圖片的生成,發(fā)布會(huì)中也用了聲中表情這個(gè)場景來進(jìn)行演示。在輸入框中輸入文字就可以生成對(duì)應(yīng)的表情圖片,如下圖:

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

紋身圖的能力我們都已經(jīng)很熟悉了,但是作者確實(shí)覺得蘋果打的這個(gè)場景對(duì)于中國用戶來說不夠好。

因?yàn)槲⑿胖凶詭У乃阉鞅砬榘哪芰Α?shí)際使用上要比單個(gè)的圖片生成體驗(yàn)更好,可以有更多的選擇,更快的速度以及一些更有趣的內(nèi)容。如下圖:

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

除了生成圖片之外,對(duì)于圖片的編輯能力蘋果也進(jìn)行了介紹,這方面都是老生常談了,就不詳細(xì)展開了。

重點(diǎn)來了!

如果說這次發(fā)布會(huì)中選出三個(gè)最重要的內(nèi)容的話,那么作者覺得有兩個(gè)是硬件上的改動(dòng)。一個(gè)是軟件層面的新東西。

二、脫胎換骨的siri

以前的Siri雖然也能回答一些簡單的問題,但是對(duì)于控制手機(jī)方面的能力是非常弱的,而全新的Siri可以完成非常復(fù)雜的任務(wù)。

例如通過語音操控就可以完成打開某個(gè)應(yīng)用。找到特定信息,再把它分享給另一個(gè)應(yīng)用中的某個(gè)聯(lián)系人。對(duì)于操作系統(tǒng)的控制可以貫穿于多個(gè)應(yīng)用和幾乎全量信息之中。

按照蘋果官網(wǎng)的介紹,在買票的場景下可以自動(dòng)找到對(duì)應(yīng)的身份號(hào)碼完成買票的操作。

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

如果用戶和他的朋友在某個(gè)聊天產(chǎn)品中進(jìn)行對(duì)話,他的朋友推薦了一首歌,這個(gè)時(shí)候用戶可以直接向Siri發(fā)布播放的命令。

Siri可以識(shí)別到屏幕上的內(nèi)容。準(zhǔn)確理解用戶的意圖,完成播放任務(wù),這種基于屏幕內(nèi)容識(shí)別和大量上下文記憶的能力在長期使用的設(shè)備中意義非常重大,可以減少非常多信息的重復(fù)表述,提升操作效率。

全新的Siri其實(shí)更像是一個(gè)通用Chatbot了。除了上面所說的完成任務(wù)之外,還可以像使用ChatGPT那樣與他進(jìn)行對(duì)話,回答問題的能力生成內(nèi)容的能力都有了極大的提升。

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

尤其是對(duì)話時(shí),對(duì)于信息的識(shí)別接收能力變得非常強(qiáng),在對(duì)話式交互的過程中,有一個(gè)難點(diǎn)就是在沒有練習(xí)過的句子人類很難非常流暢的完成表達(dá)。

一般可能會(huì)有多次的停頓或者是錯(cuò)誤的讀音,說錯(cuò)的信息等等。大家可以聯(lián)想一下在微信里發(fā)語音的過程,我們是不是經(jīng)常會(huì)遇到說錯(cuò)了話之后取消發(fā)送,又不得不重新從頭兒開始講的時(shí)候。

這種方式其實(shí)對(duì)語音交互的效率影響非常大,而蘋果這次演示的與Siri對(duì)話的過程,即使用戶說的話是磕磕巴巴的,還有錯(cuò)誤,然后又糾正。最后依然得到了正確的結(jié)果。

這種能力其實(shí)有點(diǎn)像現(xiàn)在的語音筆記產(chǎn)品。都是對(duì)于一些非?谡Z化的,容易出錯(cuò)的語音內(nèi)容進(jìn)行識(shí)別之后,再用大模型的能力進(jìn)行糾正改寫,然后得到一些更為正確的書面化的信息。

這個(gè)過程是讓命令更準(zhǔn)確的過程,也是讓機(jī)器能以更高成功率完成任務(wù)的能力。

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

三、最后一個(gè)重點(diǎn)是相機(jī)控制按鈕

要注意這個(gè)按鈕和我們剛才所說的自定義功能按鈕并不是一個(gè)而是兩個(gè)獨(dú)立的按鈕,在最新的iPhone16上,右側(cè)是開機(jī)和相機(jī)按鈕,左側(cè)是自定義功能按鈕以及音量按鈕。

雖然發(fā)布會(huì)中把這個(gè)按鈕也稱作相機(jī)相機(jī)。但仔細(xì)的理解之后就會(huì)發(fā)現(xiàn)這個(gè)按鈕其實(shí)是Apple Intelligence的重要交互入口。

作為相機(jī)的控制方式,這個(gè)按鈕雖然實(shí)現(xiàn)了更快速的打開相機(jī)進(jìn)行抓拍,并且也能夠通過單擊,雙擊,滑動(dòng)等等方式快速方便的使用相機(jī)相關(guān)的功能。

但作者覺得這個(gè)按鈕更應(yīng)該被理解成Apple Intelligence的入口。

iphone16的AI能力最全面解析,第一手內(nèi)容都在這了!

原因是蘋果把相機(jī)作為了設(shè)備與環(huán)境交互的最重要媒介。就像發(fā)布會(huì)中演示的,通過相機(jī)可以識(shí)別一家。餐廳,然后去看這家餐廳相關(guān)的評(píng)價(jià),找到預(yù)定這家餐廳位置的入口。

這方面的應(yīng)用非常重要。就像現(xiàn)在國內(nèi)都在做的AI搜索產(chǎn)品,其實(shí)還沒有一個(gè)明確的商業(yè)模式。

之前在和一些做AI搜索產(chǎn)品的朋友交流時(shí)也會(huì)發(fā)現(xiàn),大家其實(shí)都能夠意識(shí)到搜索后服務(wù)是比較重要的,但是Aftersearch能夠關(guān)聯(lián)上什么服務(wù)還沒有一個(gè)明確的答案。

有的公司認(rèn)為是要做內(nèi)容社區(qū),但是作者覺得這個(gè)方向比較遠(yuǎn),也比較虛。有的公司覺得是要做個(gè)人知識(shí)庫。相對(duì)靠譜一些但成功的幾率也不是很大。

電商其實(shí)是一種變現(xiàn)模式非常明確的選擇,但是產(chǎn)品得成為流量的來源才可以。就像上面所說的蘋果選擇了相機(jī)作為設(shè)備與環(huán)境交互的主要媒介就存在這個(gè)潛力,用戶的很多種需求的起點(diǎn)都有可能變成相機(jī)。

如果用戶能夠形成把相機(jī)作為很多種目的的起點(diǎn)。那么后續(xù)可以銜接的其他業(yè)務(wù)就非常多了。并且這種交互方式相對(duì)于GUI界面的點(diǎn)擊方式也存在效率上的優(yōu)勢(shì)。

整個(gè)發(fā)布會(huì)在作者認(rèn)知中的三大重點(diǎn)已經(jīng)講完了~

專欄作家

杜昭,微信公眾號(hào):AI與用戶體驗(yàn),人人都是產(chǎn)品經(jīng)理專欄作者,實(shí)戰(zhàn)派設(shè)計(jì)師,目前在某手機(jī)公司負(fù)責(zé)手機(jī)OS交互設(shè)計(jì),所負(fù)責(zé)產(chǎn)品覆蓋用戶數(shù)億,主要研究AI與人機(jī)交互設(shè)計(jì)的融合及人因?qū)W對(duì)用戶體驗(yàn)的影響。

題圖來自 Pixabay,基于 CC0 協(xié)議。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港