展會信息港展會大全

國產(chǎn)AI代人操作手機引發(fā)市場關注 但大模型2.0時代的答案是個人智能助理嗎?
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-10-30 15:13:27   瀏覽:0次  

導讀:劃重點01智譜AI推出自主智能體AutoGLM,可模擬人類操作手機的“Phone use能力”,引發(fā)市場關注。02AutoGLM優(yōu)先考慮用戶使用手機時最頻繁的場景,持續(xù)迭代現(xiàn)有功能并拓展應用邊界。03除此之外,vivo、榮耀等手機廠商也有類似功能升級,蘋果計劃在未來進一步集成ChatGPT服務到Siri中。04專家認為,AI與手機的結合正逐漸成為行業(yè)共識,提升個性化體驗方面具有潛力。05然而,業(yè)內(nèi)人 ......

劃重點

01智譜AI推出自主智能體AutoGLM,可模擬人類操作手機的“Phone use能力”,引發(fā)市場關注。

02AutoGLM優(yōu)先考慮用戶使用手機時最頻繁的場景,持續(xù)迭代現(xiàn)有功能并拓展應用邊界。

03除此之外,vivo、榮耀等手機廠商也有類似功能升級,蘋果計劃在未來進一步集成ChatGPT服務到Siri中。

04專家認為,AI與手機的結合正逐漸成為行業(yè)共識,提升個性化體驗方面具有潛力。

05然而,業(yè)內(nèi)人士指出,當前的“個人智能助手”與語音交互能力并無太大差別,服務端應該是越弱越好。

以上內(nèi)容由大模型生成,僅供參考

每經(jīng)記者:可楊每經(jīng)編輯:魏官紅

近日,智譜AI(人工智能)推出自主智能體AutoGLM,只需接收簡單的文字或語音指令,就可以模擬人類操作手機的“Phone use能力”。相關消息引發(fā)市場關注,甚至催生出“智譜AI概念股”。

10月29日,二級市場“智譜AI概念股”開盤即延續(xù)周一以來的漲勢,如豆神教育、思美傳媒、正和生態(tài)等個股連續(xù)兩日漲停。

一名接近智譜的人士對《每日經(jīng)濟新聞》記者表示,AutoGLM在開發(fā)、適配的過程中,優(yōu)先考慮了用戶使用手機時最頻繁的場景,當前,智譜依舊在持續(xù)迭代AutoGLM現(xiàn)有功能,并將基于用戶使用高頻場景,不斷拓展AutoGLM的應用邊界。

據(jù)悉,智譜已與中國三星深度合作,核心是將智譜的GLM大模型與三星的硬件技術相結合,以提升用戶的智能體驗。其實,AI在手機端的應用探索并非僅此一例,vivo、榮耀等都有類似功能升級,蘋果也計劃在未來進一步集成ChatGPT服務到Siri中。有學者在受訪時指出,AI與手機的結合正逐漸成為行業(yè)共識,這背后反映的是生成式AI在提升個性化體驗方面的潛力。

但也有業(yè)內(nèi)人士向記者指出,當前的“個人智能助手”與此前的語音交互能力并無太大差別,從長期來看,服務端應該是越弱越好,難點并不在于技術或商業(yè)模式,而在于用戶習慣。

推出AutoGLM 智譜加速布局個人智能助理

據(jù)智譜發(fā)布的演示Demo(樣本),基于AutoGLM,用戶向手機下達“幫我在淘寶下單淘寶里上個月買過的牙膏”的指令,手機就能自動執(zhí)行“AI打開App找到歷史訂單完成訂單篩選請求用戶支付完成支付”的過程。

智譜方面表示,理論上,AutoGLM可以完成人類在電子設備上可以做的任何事,它不受限于簡單的任務場景或API調(diào)用,也不需要用戶手動搭建復雜繁瑣的工作流,操作邏輯與人類類似。

中信證券在研報中提到,隨著互聯(lián)網(wǎng)軟件的種類、功能越來越豐富,智能體能否熟練地掌握每個軟件的使用方法,滿足不同用戶的個性化需求,真正成為個人助手值得期待。從以聊天為主的大模型1.0時代邁入個人智能助理的大模型2.0時代,以智譜為代表的國產(chǎn)AI公司完成了從追趕者到領路人的身份轉換。

國產(chǎn)AI代人操作手機引發(fā)市場關注 但大模型2.0時代的答案是個人智能助理嗎?

圖片來源:視覺中國-VCG41N1256249270

從用戶的日常操作到潛在的商業(yè)應用,AutoGLM除了在“Phone use能力”層面的想象空間,未來的應用場景會如何拓展?

一名接近智譜的人士對《每日經(jīng)濟新聞》記者表示,AutoGLM在開發(fā)、適配的過程中,優(yōu)先考慮了用戶使用手機時最頻繁的場景。作為一個內(nèi)測版本,AutoGLM還存在一些問題,當前智譜依舊在持續(xù)迭代AutoGLM現(xiàn)有功能,并將基于用戶使用高頻場景,不斷拓展AutoGLM的應用邊界,同時保護用戶隱私。

在技術突破層面,上述人士表示,AutoGLM基于智譜自研的“基礎智能體解耦合中間界面”和“自進化在線課程強化學習框架”。其中的核心技術WebRL,克服了大模型智能體在任務規(guī)劃與動作執(zhí)行中存在的能力拮抗、訓練任務和數(shù)據(jù)稀缺、反饋信號稀少和策略分布漂移等智能體研究和應用難題,同時,借助自適應學習策略,能夠在迭代過程中不斷改進、持續(xù)穩(wěn)定地提高自身性能。“就像一個人,在成長過程中,不斷獲取新技能!

共識與非共識:端側語音交互是進步還是倒退?

大模型在端側應用的探索正在加速。

華鑫證券在其研報中預測,AI Agent的中國市場規(guī)模有望從2023年的554億元增長至2028年的8520億元,年復合增長率高達72.7%。中信建投則在研報中表示,預計在不久的將來會進入大模型時代的2.0時代:AI Agent。

在接受《每日經(jīng)濟新聞》采訪時,清華大學新聞學院和人工智能學院雙聘教授沈陽指出,AI與手機結合正逐漸成為行業(yè)共識,而這背后反映的是生成式AI在提升個性化體驗方面的潛力。同時,隨著硬件與AI服務的一體化設計日趨完善,AI正在引發(fā)人機交互的范式變革,推動手機與用戶之間的關系從簡單的操作工具轉變?yōu)閯討B(tài)互動。沈陽認為,這一趨勢同樣將深刻影響國內(nèi)市場,預計未來將有更多智能設備采用AI驅動的交互模式,從而極大提升用戶體驗。

在國內(nèi),除了智譜推出的AutoGLM,僅今年10月,就有數(shù)家廠商在端側有所動作。vivo推出藍心端側大模型3B,稱服務超5億手機用戶;字節(jié)發(fā)布首款AI智能體耳機Ola Friend,與豆包集成;榮耀推出MagicOS 9.0,打造AI OS實現(xiàn)一句話充值、一句話點外賣等服務。

在國際市場上,科技巨頭們同樣動作頻頻。蘋果在10月28日宣布推出AI功能,并計劃在未來進一步集成ChatGPT服務到Siri中;微軟則開源了OmniParser工具,為用戶提供了如自動訂票等便捷功能;谷歌計劃將推出Gemini 2.0,并正在開發(fā)能自動化執(zhí)行Chrome網(wǎng)頁任務的“Project Jarvis”,該項目將幫助用戶執(zhí)行諸如“收集研究、購買產(chǎn)品或預訂航班”等任務。

不過,也有人對當前AI應用在端側類似“個人智能助手”的探索持反對態(tài)度!霸谖铱磥矶藗仁堑雇!币患褹I應用公司創(chuàng)始人在接受《每日經(jīng)濟新聞》記者采訪時表示,從長期來看,服務端應該是越弱越好。他認為,當前無論是硬件設備、軟件應用,還是交互方式,均未超越上一輪語音交互熱潮期間入局企業(yè)所進行的探索范疇。或許在某些特定場景下,諸如蘋果這樣的行業(yè)巨頭,具備教育用戶或改變用戶需求的潛力,但極為困難,其難點并不在于技術或商業(yè)模式,而在于用戶習慣。

上述AI應用公司創(chuàng)始人認為,99%的用戶在表達需求時,不可能用一句話闡明具體意圖,更多是以一種“擠牙膏式”的互動一步步完成,例如,用戶需要訂一張北京飛往上海的機票,大部分用戶往往發(fā)出的第一句指令只有簡單的幾個字:訂機票,余下需求則需要通過提問再完成!暗谝皇怯脩魶]這個需求,第二是真正用起來,肯定會出現(xiàn)各種奇奇怪怪的問題,我對語音助手是非常悲觀的!

他進一步補充道,盡管相關技術已經(jīng)經(jīng)歷了多次迭代,相較于過去已有顯著提升,但問題的核心仍在于需求的精準把握與滿足。

操作系統(tǒng)、生態(tài)尋找破局之路

在端側應用的探索中,智譜當前瞄準的破局點或許與操作系統(tǒng)有關。

AutoGLM是智譜按照AGI通用人工智能升級路線圖進行的探索和嘗試之一。智譜CEO張鵬曾談及對面向AGI的分級的思考,他認為,L1是語言能力,L2是邏輯與思維能力,L3是工具能力,L4級人工智能意味著AI可以實現(xiàn)自我學習、自我反思和自我改進。L5則意味著人工智能全面超越人類,具備探究科學規(guī)律、世界起源等終極問題的能力。

上述接近智譜的人士表示,AutoGLM可以看作是智譜在人工智能能力分級L3“使用工具能力”方面的探索和嘗試,借此努力推動人機交互范式實現(xiàn)新轉變,為構建GLM-OS,即以大模型為中心的通用計算系統(tǒng)打好基礎。進而,基于已有All-Tools能力加上內(nèi)存記憶(memory)和自我反饋(self-reflection)機制,GLM-OS有望實現(xiàn)模仿人類的Plan-Do-Check-Act循環(huán)。

榮耀CEO趙明也曾在該公司發(fā)布會上談到,MagicOS自誕生之初就致力于打造屬于未來的操作系統(tǒng),構建以AI為核心的智能操作系統(tǒng)(AI OS)。

在技術突破之外,另一個破局點或許在于生態(tài)的建立以及用戶使用習慣的培養(yǎng)。

盡管對語音交互持悲觀態(tài)度,但上述AI應用公司創(chuàng)始人坦言,用戶的需求也不是鐵板一塊,完全不能動搖。盡管他認為改變用戶需求的難度很大,但對于科技巨頭能否做到,他持觀望態(tài)度。

數(shù)字經(jīng)濟專家劉興亮也對《每日經(jīng)濟新聞》記者表示,像蘋果這樣擁有大量用戶的公司,AI功能的融入確實有望改變用戶的行為習慣,尤其是通過改善用戶體驗,使其日常使用更加便捷、高效。例如,AI驅動的健康管理、出行助手等功能,將提升用戶對品牌的黏性和依賴度,從而帶來更多生態(tài)系統(tǒng)內(nèi)的交叉銷售機會。其他企業(yè)則可以從中借鑒,通過AI來增強用戶體驗,建立長期的品牌價值,而不僅是局限于一項具體功能的提升。

沈陽則認為,對于像蘋果這樣擁有巨量用戶基礎的公司來說,AI功能的融入有望培養(yǎng)用戶的新行為習慣,讓手機實現(xiàn)從工具使用到智能助手的轉變,還能促使用戶逐漸適應通過語音與設備交互,減少手動操作,逐漸習慣使用AI自動化處理,減少在多個應用間切換的需求。

沈陽指出,在大模型和AI應用融入手機、PC等設備時,還需解決用戶個性化不足與上下文理解局限的問題。這需要通過在設備端保存更多對話和用戶操作習慣來增強AI的跨會話理解力和準確性。同時,多模態(tài)集成也是關鍵,將文本、語音、圖像等輸入形式結合,能顯著提升AI處理復雜指令的能力。針對跨設備無縫體驗的挑戰(zhàn),沈陽建議采用統(tǒng)一的AI框架來增強跨設備的智能助手一致性,確保用戶在任何設備上都能獲得相同的AI體驗,并優(yōu)化設備間數(shù)據(jù)同步的速度。

在沈陽看來,未來,AI應用的趨勢將朝著多模態(tài)AI、深化個性化服務以及3D AIGC與AR/VR結合的方向發(fā)展。然而,在這個過程中,用戶的期待與現(xiàn)實之間存在差距,如AI的精確性與可靠性問題、隱私與數(shù)據(jù)使用的顧慮以及使用門檻和學習成本高等挑戰(zhàn)。

劉興亮則表示,在未來一段時間內(nèi),AI技術的實際應用前景依然廣闊,但的確面臨著如何在用戶期望和實際需求之間找到平衡的問題。行業(yè)可能需要調(diào)整發(fā)展方向,在商業(yè)化過程中保持技術與需求的同步發(fā)展。找到商業(yè)化與實用性的結合點尤為重要,比如開發(fā)更貼合具體場景的AI產(chǎn)品,并且關注用戶反饋和使用數(shù)據(jù),通過小步快跑的方式持續(xù)優(yōu)化,才能真正提升AI的落地效果和市場接受度。

每日經(jīng)濟新聞

贊助本站

相關內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能實驗室 版權所有    關于我們 | 聯(lián)系我們 | 廣告服務 | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港