展會(huì)信息港展會(huì)大全

外灘大會(huì)上,我們看到了人工智能五年后的樣子
來(lái)源:互聯(lián)網(wǎng)   發(fā)布日期:2024-09-09 14:31:51   瀏覽:2127次  

導(dǎo)讀:機(jī)器之心發(fā)布 機(jī)器之心編輯部 在一些悲觀者看來(lái),人工智能的發(fā)展似乎變慢了。 2022 年底,ChatGPT 發(fā)布,五天用戶(hù)注冊(cè)超過(guò)百萬(wàn),兩個(gè)月后月活用戶(hù)超過(guò) 1 億,以此為起點(diǎn),幾乎每家科技大公司都卷入這場(chǎng)生成式 AI 的風(fēng)暴當(dāng)中,幾乎每個(gè)科技創(chuàng)業(yè)者也都試圖尋找...

機(jī)器之心發(fā)布

機(jī)器之心編輯部

在一些悲觀者看來(lái),人工智能的發(fā)展似乎變慢了。

2022 年底,ChatGPT 發(fā)布,五天用戶(hù)注冊(cè)超過(guò)百萬(wàn),兩個(gè)月后月活用戶(hù)超過(guò) 1 億,以此為起點(diǎn),幾乎每家科技大公司都卷入這場(chǎng)生成式 AI 的風(fēng)暴當(dāng)中,幾乎每個(gè)科技創(chuàng)業(yè)者也都試圖尋找起飛的機(jī)會(huì),半年融資兩輪、一年估值破 10 億美元的 “黃金時(shí)代” 似乎又回來(lái)了,a16z 創(chuàng)始人 Marc Andreessen 2011 年提出「軟件在蠶食世界」(Software is eating the world),在 2023 年,大家談?wù)摰脑?huà)題變成了「人工智能蠶食世界」(AI is eating the world)。

然而,等到 2024 年,世界似乎依然是那個(gè)世界,我們的日常生活幾乎沒(méi)有因?yàn)槿斯ぶ悄馨l(fā)生任何變化,應(yīng)用層面的 “iPhone 時(shí)刻” 始終只出現(xiàn)在各類(lèi)演講里,而非我們的手頭上。

在技術(shù)端,大模型本身的能力也出現(xiàn)了諸多問(wèn)題,GPT 5.0 遲遲未能發(fā)布,這讓大家疑惑 Scaling Law 曲線(xiàn)是否正在放緩,進(jìn)而質(zhì)疑 Transformer 架構(gòu)本身的潛力;大模型的「幻覺(jué)問(wèn)題」也始終影響應(yīng)用層面的落地,甚至有論文認(rèn)為經(jīng)過(guò)校準(zhǔn)的語(yǔ)言模型必然會(huì)出現(xiàn)幻覺(jué),與數(shù)據(jù)質(zhì)量或者算法架構(gòu)本身無(wú)關(guān) 換言之,這幾乎是個(gè)不可能解決的問(wèn)題。

樂(lè)觀者則認(rèn)為,這些只是當(dāng)技術(shù)爆炸真正進(jìn)入日常世界時(shí)候,必然出現(xiàn)的緩沖期。

技術(shù)爆發(fā)時(shí)候,我們往往過(guò)于興奮,以為未來(lái)正加速到來(lái),不過(guò),世界本身有自己的運(yùn)作規(guī)律,需要基礎(chǔ)設(shè)施來(lái)承接,需要應(yīng)用層面來(lái)落地,甚至需要法律、道德和倫理層面做好更多準(zhǔn)備。在外灘大會(huì)上,他們?yōu)樽约旱臉?lè)觀能夠找到充足的理由。

九月初,外灘大會(huì)在上海舉辦,上海黃浦世博園區(qū)也成了看見(jiàn) AI 未來(lái)趨勢(shì)的最重要窗口。有人在討論它是否能夠疏解孤獨(dú),也有人在討論能否幫助緩解全球變暖,在展區(qū)里,依然有著眾多帶著創(chuàng)造力的人,來(lái)展示他們用 AI 設(shè)想的未來(lái)。我們對(duì) AI 的悲觀或者樂(lè)觀,背后都隱含著我們對(duì)它的期待。

外灘大會(huì)上,我們看到了人工智能五年后的樣子

每個(gè)問(wèn)題都是 AI 繼續(xù)進(jìn)化的契機(jī)。在外灘大會(huì)上,我們能夠看到人工智能依然在發(fā)展,在論壇的討論里,在每個(gè)展廳里,我們能夠看到五年后 AI 的樣貌。

「算力軍備競(jìng)賽」可能不會(huì)結(jié)束, 但平衡成本和提升效率越發(fā)重要

2020 年,OpenAI 在一篇論文里提出 Scaling law,大意是大模型的性能與模型的具體結(jié)構(gòu) 深度、寬度和層數(shù) 基本無(wú)關(guān),主要由計(jì)算量、模型參數(shù)量和訓(xùn)練數(shù)據(jù)量三者的大小有關(guān)。

這一論斷被稱(chēng)為 AI 領(lǐng)域的「摩爾定律」,也因?yàn)?OpenAI 的成功而成了很多從業(yè)者信奉的圭臬。在這一信念指引下,大模型的發(fā)展向著大算力、大參數(shù)和大數(shù)據(jù)的方向發(fā)展。先前的 AI 發(fā)展主要基于對(duì)各類(lèi)模型的優(yōu)化,而 Scaling Law 代表著一種新的范式:倘若有足夠大的算力和數(shù)據(jù),我們便能夠解決人工智能發(fā)展的問(wèn)題。

算力軍備競(jìng)賽也由此開(kāi)始。李飛飛團(tuán)隊(duì)新近發(fā)布的《人工智能指數(shù)報(bào)告》顯示,最新人工智能模型的訓(xùn)練成本已經(jīng)達(dá)到歷史新高。GPT-4 的訓(xùn)練過(guò)程耗費(fèi)了約 7800 萬(wàn)美元的計(jì)算資源,谷歌的 Gemini Ultra 模型的訓(xùn)練成本更是高達(dá) 1.91 億美元。微軟也啟動(dòng)「星際之門(mén)」超級(jí)計(jì)算機(jī)計(jì)劃,預(yù)計(jì)投資將達(dá)到 1150 億美元,而谷歌也迅速表示將在算力方面有更慷慨的投資。

烽火燃不息,倘若我們想要發(fā)展更好的大模型,在技術(shù)上繼續(xù)有所突破,那么這場(chǎng)軍備競(jìng)賽便不可能結(jié)束。不過(guò),倘若目標(biāo)是應(yīng)用落地和商業(yè)閉環(huán),那么落地部署的效率和成本與技術(shù)本身一樣重要。于是,優(yōu)化算力效率,提高數(shù)據(jù)質(zhì)量,成了各個(gè)企業(yè)關(guān)注的焦點(diǎn)。

外灘大會(huì)上,我們看到了人工智能五年后的樣子

企業(yè)需要關(guān)注如何通過(guò)技術(shù)創(chuàng)新來(lái)實(shí)現(xiàn)算力的經(jīng)濟(jì)實(shí)用,以在不犧牲性能的情況下,控制投入成本,而異構(gòu)計(jì)算是實(shí)現(xiàn)這一目標(biāo)的關(guān)鍵技術(shù)之一。

異構(gòu)計(jì)算是一種將不同類(lèi)型和架構(gòu)的計(jì)算單元,如 CPU、GPU、DSP、ASIC、FPGA 等,整合到一個(gè)系統(tǒng)中以提高計(jì)算性能和能效的技術(shù),能夠同時(shí)處理多種類(lèi)型的計(jì)算任務(wù),如圖形處理、科學(xué)計(jì)算和 AI 推理,這使得它們非常適合現(xiàn)代數(shù)據(jù)中心和 AI 應(yīng)用的需求。

異構(gòu)計(jì)算優(yōu)勢(shì)明顯。它可以協(xié)同多種計(jì)算單元,顯著提高處理速度和系統(tǒng)吞吐量,尤其適用于大規(guī)模并行計(jì)算任務(wù),并能將任務(wù)分配給最適合的計(jì)算單元執(zhí)行,可以?xún)?yōu)化能源利用效率,降低數(shù)據(jù)中心的能耗。同時(shí),異構(gòu)計(jì)算支持靈活的硬件配置和軟件編程,能夠根據(jù)需求輕松擴(kuò)展系統(tǒng)能力,開(kāi)發(fā)者也能夠根據(jù)算法需求選擇最合適的硬件平臺(tái)。

未來(lái)五年,異構(gòu)計(jì)算需要逐步解決現(xiàn)有的問(wèn)題,才能走向普及。異構(gòu)計(jì)算需要開(kāi)發(fā)者具備跨平臺(tái)的編程和優(yōu)化技能,缺乏統(tǒng)一的編程框架和標(biāo)準(zhǔn),增加了開(kāi)發(fā)難度,導(dǎo)致開(kāi)發(fā)效率受限。此外,雖然長(zhǎng)期來(lái)看成本更低,但初期硬件投資和研發(fā)成本相比現(xiàn)有成熟方案依然很高,需要大公司率先投入,促進(jìn)應(yīng)用。

比起大模型,小模型更可能誕生「大應(yīng)用」

大約十五年前,移動(dòng)互聯(lián)網(wǎng)開(kāi)始繁榮,也迎來(lái)了創(chuàng)業(yè)的黃金時(shí)代。與之相比,AI 時(shí)代創(chuàng)業(yè)更加艱難,首先因?yàn)槌杀靖撸枰懔、?shù)據(jù)、電力等外界條件,訓(xùn)練大模型所需要的資金,幾乎沒(méi)有草根創(chuàng)業(yè)者能夠負(fù)擔(dān)。在大模型領(lǐng)域,很可能會(huì)出現(xiàn)「贏家通吃」,最終只剩下幾個(gè)主要的模型廠商。

不過(guò),AI 是個(gè)龐大的生態(tài),在算法、算力、數(shù)據(jù)和系統(tǒng)等領(lǐng)域都有著大量機(jī)會(huì)。

在外灘大會(huì)上,一個(gè)被討論很多的機(jī)會(huì)是數(shù)據(jù)服務(wù)商。AI 大模型的性能在很大程度上取決于訓(xùn)練數(shù)據(jù)的規(guī)模和質(zhì)量。數(shù)據(jù)數(shù)量的增加可以提供更多的樣本,使模型能夠?qū)W習(xí)到更多的特征和模式。如今 AI 發(fā)展的重要瓶頸,是現(xiàn)實(shí)世界的數(shù)據(jù)接近枯竭,而合成數(shù)據(jù)依然存在著很多問(wèn)題,比如無(wú)法反映物理世界的復(fù)雜情況等。

于是,一批新型的數(shù)據(jù)服務(wù)商便可能成為 AI 時(shí)代的「賣(mài)水人」。它需要以更高的效率完成包括數(shù)據(jù)清洗、數(shù)據(jù)標(biāo)注、數(shù)據(jù)整合和數(shù)據(jù)安全措施等方面的工作,確保數(shù)據(jù)的來(lái)源可靠、處理過(guò)程透明和結(jié)果可驗(yàn)證。高質(zhì)量的數(shù)據(jù)為 AI 模型提供學(xué)習(xí)的基礎(chǔ),從而形成數(shù)據(jù)飛輪,推動(dòng)其不斷進(jìn)化和改進(jìn)。

外灘大會(huì)上,我們看到了人工智能五年后的樣子

更大的創(chuàng)業(yè)機(jī)會(huì)在應(yīng)用端,尤其是在行業(yè)領(lǐng)域。不過(guò),通往行業(yè)落地的大門(mén)可能并非大模型,而是小模型 / 端側(cè)模型。

嚴(yán)格來(lái)說(shuō),「小模型」與「端側(cè)模型」并不等同。小模型通常指的是參數(shù)規(guī)模遠(yuǎn)少于 GPT-3 或 Llama-13B 的大語(yǔ)言模型,如 1.5B、3B、7B 等;「端智能」則指的是部署在手機(jī)、電腦等用戶(hù)設(shè)備上的模型,通常計(jì)算資源受限,無(wú)法直接運(yùn)行大模型,于是也要特別設(shè)計(jì)新的模型。二者目標(biāo)不同,不過(guò)終端設(shè)備能夠流暢運(yùn)行的,往往都是小模型,因此存在很多重合,我們也不做細(xì)致的區(qū)分。

小模型雖然參數(shù)規(guī)模小,不過(guò)往往專(zhuān)注于某一領(lǐng)域和任務(wù)的設(shè)計(jì)和優(yōu)化,在這些方面可以達(dá)到甚至超過(guò)大模型的性能,如 Mistral-7B 模型在某些基準(zhǔn)測(cè)試中超越了參數(shù)量更大的模型,顯示出小模型在特定任務(wù)上的優(yōu)勢(shì)。

因?yàn)樗懔湍茉聪牡,小模型更適合落地應(yīng)用。在端側(cè),蘋(píng)果在 iPhone 上使用的 DCLM 模型參數(shù)量為 70 億。傅盛也曾提到,企業(yè)專(zhuān)用模型大概只需要百億參數(shù) 作為對(duì)比,GPT 4 的參數(shù)量高達(dá) 1.7 萬(wàn)億。

小模型的發(fā)展將帶來(lái)端智能的普及,未來(lái)五年率先落地的可能是一批「博士」水平的專(zhuān)業(yè) AI。外灘大會(huì)上已經(jīng)能看到不少很有潛質(zhì)的產(chǎn)品雛形,涉及醫(yī)療、能源、教育等領(lǐng)域。借助這些專(zhuān)門(mén)化的 AI 工具,企業(yè)可以更容易地將 AI 技術(shù)集合到業(yè)務(wù)流程中,在行業(yè)中落地應(yīng)用。

行業(yè)側(cè)的落地應(yīng)用也將有助于 AI 本身的進(jìn)化。各個(gè)領(lǐng)域存在大量數(shù)據(jù),在利用 AI 優(yōu)化決策、提高效率的同時(shí),AI 也能獲得更高質(zhì)量的數(shù)據(jù),模型和算法也會(huì)不斷演進(jìn)與改變,從而推動(dòng)整個(gè)人工智能領(lǐng)域的發(fā)展與成熟。

端智能可能是大模型的終局,但手機(jī)智能未必是

如今提到端側(cè)模型,往往指的是手機(jī),因?yàn)檫@是我們隨手可觸及的算力最強(qiáng)的設(shè)備,不過(guò),手機(jī)可能只是端智能的過(guò)渡階段。

手機(jī)智能的瓶頸很明顯,首先是算力不足,但更重要的可能是內(nèi)存不足。相比云端服務(wù)器,手機(jī)等設(shè)備的內(nèi)存容量和存儲(chǔ)空間都要小很多,但即便是小模型依然需要占用大量空間。

內(nèi)存之外,能源和功耗問(wèn)題也是一個(gè)問(wèn)題。AI 計(jì)算過(guò)程功耗巨大,很容易導(dǎo)致電池電量不足,設(shè)備發(fā)熱,甚至影響系統(tǒng)總體穩(wěn)定性。

現(xiàn)在的解決方案一方面是提升手機(jī)性能,一方面則是設(shè)計(jì)更小的模型,以確保在有限的內(nèi)存、算力、功耗限制下高效運(yùn)行,如蘋(píng)果便從 0 構(gòu)建了專(zhuān)門(mén)的小模型,而非對(duì)現(xiàn)有的大模型來(lái)裁剪。

不過(guò),長(zhǎng)期來(lái)看,或許我們會(huì)有新的 AI Agent,成為人工智能時(shí)代下的新型終端形態(tài)。

外灘大會(huì)上,我們看到了人工智能五年后的樣子

我們期待的 AI Agent 并非簡(jiǎn)單地執(zhí)行指令,而更像是具身智能理念在人工智能領(lǐng)域的具體體現(xiàn),具有更高級(jí)別的自主性和智能,是能夠在環(huán)境中自主行動(dòng)、感知并做出決策的智能實(shí)體。

這意味著,AI Agent 不僅能夠處理虛擬任務(wù),還能夠在物理世界中執(zhí)行動(dòng)作,提供更加豐富和直觀的用戶(hù)體驗(yàn)。這種結(jié)合也推動(dòng)了人工智能在多個(gè)領(lǐng)域的創(chuàng)新應(yīng)用,如自動(dòng)駕駛汽車(chē)、智能家居、工業(yè)自動(dòng)化等。

我們與 AI Agent 的交互方式也將發(fā)生新的變化。從早期的機(jī)器語(yǔ)言到圖形用戶(hù)界面(GUI)、手勢(shì)控制,再到現(xiàn)在的全模態(tài)自然語(yǔ)言交互,人機(jī)交互的方式不斷演進(jìn)。全模態(tài)交互意味著機(jī)器可以通過(guò)多種方式(如語(yǔ)音、視覺(jué)、觸覺(jué)等)理解和響應(yīng)人類(lèi)的指令,使得交互更加自然和直觀。

隨著交互方式的演進(jìn),機(jī)器不再僅僅是工具,而是能夠提供陪伴、協(xié)助和情感支持的伙伴;應(yīng)用入口也不再局限于傳統(tǒng)的操作系統(tǒng)或應(yīng)用程序界面,而是可以通過(guò)多種設(shè)備和場(chǎng)景進(jìn)行交互。

這或許不會(huì)在 5 年的時(shí)間里發(fā)生,不過(guò)三到五年之后,更多人會(huì)擁有可以支持端側(cè)模型的手機(jī),一批 AI 應(yīng)用也將全面落地,AI 也將真正跨越鴻溝,走向生活。在這之后,新型終端形態(tài)也將走出原型階段,擁有早期使用者,為進(jìn)一步普及打下基矗

結(jié)語(yǔ)

在瓦特之前半個(gè)世紀(jì),蒸汽機(jī)技術(shù)和相關(guān)理論已經(jīng)成熟,然而瓦特讓蒸汽機(jī)終于能夠在生產(chǎn)中使用,并且將它推廣到了市場(chǎng)上。即便如此,又過(guò)了近半個(gè)世紀(jì),蒸汽機(jī)在紡織廠普及,蒸汽輪船也開(kāi)始成為河運(yùn)主力,蒸汽機(jī)才真正「蠶食世界」。

當(dāng)下時(shí)代,技術(shù)傳播與發(fā)展的時(shí)間周期大大縮短,但我們依然需要經(jīng)歷每個(gè)階段。過(guò)去兩年里,我們見(jiàn)證了 AI 技術(shù)的爆發(fā),未來(lái)五年,或許正式找到屬于 AI 的紡織廠和蒸汽輪船的時(shí)候。

iPhone 在美國(guó)誕生,不過(guò)移動(dòng)互聯(lián)網(wǎng)最繁榮的市場(chǎng)之一是中國(guó);蛟S未來(lái)五年,我們也能看到更多 AI 應(yīng)用和場(chǎng)景的爆發(fā),形成繁榮的中國(guó) AI 應(yīng)用生態(tài)。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開(kāi)

熱門(mén)欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港