原文作者:Brian Owens
私營企業(yè)在人工智能方面的投入遠(yuǎn)超學(xué)術(shù)界,但健康發(fā)展需要多方的投入。
來源: Neil Webb
如果不是學(xué)術(shù)界的早期研究,可能就不會有人工智能(AI)眼下的繁榮。如今日常生活中使用的許多技術(shù),如機(jī)器學(xué)習(xí)和自然語言處理,都是由數(shù)十年前的人工神經(jīng)網(wǎng)絡(luò)學(xué)術(shù)研究支撐的。但可以肯定的是,人工智能領(lǐng)域許多最新的尖端和備受矚目的研究并非在大學(xué)實驗室進(jìn)行,而是在私營公司的緊閉的幕布之后開展。
德國亞琛工業(yè)大學(xué)的人工智能研究員Holger Hoos表示:“我們越來越多地看到,頂尖的人工智能研究主要在少數(shù)美國公司的研究實驗室內(nèi)完成。
這些研究大多并未發(fā)表在領(lǐng)先的同行評議科學(xué)期刊上。2023 年,企業(yè)研究僅占美國自然指數(shù)人工智能總產(chǎn)出的 3.84%。但其他來源的數(shù)據(jù)顯示,企業(yè)在研究中的影響力逐漸增加。去年發(fā)表在Science的一篇論文1中,在劍橋麻省理工學(xué)院研究創(chuàng)新和人工智能的 Nur Ahmed 和他的同事發(fā)現(xiàn),有一位或多位產(chǎn)業(yè)界合著者參與的研究文章占主要人工智能會議演講的比例,從 2000 年的 22% 增長到 2020 年的 38%。產(chǎn)業(yè)界在最大、因而也最強(qiáng)的人工智能模型中的份額,從 2010 年的 11% 增長到 2021 年的 96%。在用于評估人工智能模型性能的一組 20 個基準(zhǔn)測試(例如圖像識別、情感分析和機(jī)器翻譯方面的能力)中,2017 年之前僅產(chǎn)業(yè)界、或產(chǎn)業(yè)界與大學(xué)合作的工作,在62%的情況下?lián)碛蓄I(lǐng)先模型,自 2020 年以來這一比例已增長到 91%。“產(chǎn)業(yè)界正日益主導(dǎo)這一領(lǐng)域。”Ahmed 說。
人工智能研究成果日益占據(jù)主導(dǎo)地位,很大程度上得益于行業(yè)在資金方面的巨大優(yōu)勢。2021 年,美國政府機(jī)構(gòu)(不包括國防部)在人工智能研發(fā)上花費(fèi)了 15 億美元,歐盟委員會花費(fèi)了 10 億歐元(11 億美元)。全球行業(yè)花費(fèi)超過 3400 億美元。
Ahmed說,這種支出使得行業(yè)控制了三大最重要的投入:計算力、大數(shù)據(jù)集和人才。
公司擁有比學(xué)術(shù)機(jī)構(gòu)更強(qiáng)大的計算能力,包括購買所需的圖形處理單元(AI 中最常用的芯片),甚至可以設(shè)計和制造自己的芯片。這使得公司能夠創(chuàng)建比學(xué)術(shù)機(jī)構(gòu)更大、更復(fù)雜的模型。2021 年,行業(yè) AI 模型平均比學(xué)術(shù)模型大 29 倍。
公司還可以訪問更大的數(shù)據(jù)集來訓(xùn)練這些模型,因為它們的商業(yè)平臺會在用戶與它們交互時自然產(chǎn)生這些數(shù)據(jù)。德國亥姆霍茲慕尼黑的計算生物學(xué)家 Fabian Theis 說:“在訓(xùn)練用于自然語言處理的最先進(jìn)的大型語言模型方面,學(xué)術(shù)界很難趕上。”
豐厚的薪水以及能夠從事人工智能最前沿技術(shù)工作的承諾,使得公司能夠從大學(xué)搶走大量頂尖人才,而在學(xué)術(shù)界計算機(jī)科學(xué)院系,招聘基本保持平穩(wěn)。
“行業(yè)招聘遠(yuǎn)高于計算機(jī)科學(xué)研究教師的總體增長,”Ahmed 說。2004 年,北美大學(xué)只有 21% 的人工智能博士進(jìn)入產(chǎn)業(yè)界工作,但到 2020 年,這一數(shù)字接近 70%。這種日益加劇的不平衡讓學(xué)術(shù)界的一些人感到擔(dān)憂。最大的擔(dān)憂是,公司必然關(guān)注利潤,這不僅影響他們尋求開發(fā)的人工智能產(chǎn)品類型,還會影響他們提出的研究問題。“如果對社會有重大影響的發(fā)展主要由短期商業(yè)利益驅(qū)動,我們就有麻煩了。”Hoos 說。
英國愛丁堡大學(xué)研究人工智能倫理的 Shannon Vallor 表示,學(xué)術(shù)界的人工智能研究需要為知識體系的發(fā)展做出貢獻(xiàn),而這種知識體系并非源自商業(yè)目的。“學(xué)術(shù)界是僅有的樂土,允許研究人員在沒有明顯盈利路線圖的情況下繼續(xù)工作。”她說。
Vallor 表示,學(xué)者可以對人工智能提出批判性和冷靜的看法,作為獨(dú)立信息來源判斷哪些技術(shù)可行、哪些不可行,識別新技術(shù)的潛在危害,以及如何減輕危害。學(xué)者還可以幫助將人工智能研究與公眾利益結(jié)合起來。Vallor 表示:“目前缺少人工智能應(yīng)用,能專注于我們最需要解決的問題。”這些挑戰(zhàn)包括氣候變化、醫(yī)療保健需求以及因數(shù)字技術(shù)而加劇的社會和民主壓力。
盡管研究人工智能的倫理和社會后果非常重要,但許多學(xué)者仍擔(dān)心,由于行業(yè)內(nèi)現(xiàn)有的激勵機(jī)制,企業(yè)對負(fù)責(zé)任地使用人工智能的研究投入不足,未能吸取此類研究的經(jīng)驗教訓(xùn)。Ahmed 和其他同事的分析2證實了這一懷疑。與傳統(tǒng)人工智能論文相比,領(lǐng)先的人工智能公司在負(fù)責(zé)任的人工智能研究方面的產(chǎn)出明顯較低。他們進(jìn)行的負(fù)責(zé)任的人工智能研究范圍也較窄,涉及主題缺乏多樣性。
Ahmed 表示:“大型人工智能公司在負(fù)責(zé)任的人工智能研究中極少有公共參與,這表明在人工智能開發(fā)中,速度優(yōu)先于安全。”他們還發(fā)現(xiàn)負(fù)責(zé)任的人工智能研究與其實際實施之間存在脫節(jié)。Ahmed 說,“進(jìn)入市場的人工智能產(chǎn)品受到負(fù)責(zé)任的人工智能研究結(jié)果的影響有限。”
Vallor 表示,過去企業(yè)在負(fù)責(zé)任的人工智能研究方面曾投入更多資金,但隨著生成式人工智能的蓬勃發(fā)展,這種興趣逐漸減弱,引發(fā)了一場利用市場的“向下競爭”。“關(guān)于負(fù)責(zé)任人工智能的知識已經(jīng)存在,問題是大型人工智能公司沒有動力去應(yīng)用它。”她說。“但我們可以改變激勵機(jī)制。”
企業(yè)投入
2023 年,美國企業(yè)的人工智能(AI)研究在《自然指數(shù)》期刊中的份額最高。但在企業(yè) AI 產(chǎn)出最高的五個國家中,日本企業(yè)的產(chǎn)出占該國數(shù)據(jù)庫中研究總量的比例最高。
她建議,負(fù)責(zé)任地開發(fā)和部署人工智能的公司可以擔(dān)負(fù)較輕稅收。“那些不想采用負(fù)責(zé)任的人工智能標(biāo)準(zhǔn)的公司應(yīng)該支付費(fèi)用,補(bǔ)償那些受到危害和生計受到損害的公眾。” Vallor說。
在等待新法規(guī)出臺的同時,學(xué)術(shù)界在關(guān)注行業(yè)同行方面發(fā)揮著重要作用。需要開展學(xué)術(shù)研究,找出并解決人工智能系統(tǒng)固有偏見等問題,以幫助該領(lǐng)域朝著更負(fù)責(zé)任的方向發(fā)展。“需要有制衡,這不能僅靠監(jiān)管來實現(xiàn),還需要獨(dú)立專家的審查。”Hoos 說。“至關(guān)重要的是,大學(xué)等公共資助機(jī)構(gòu)里必須擁有與行業(yè)類似的專業(yè)知識。”
然而,要進(jìn)行這種審查,學(xué)術(shù)界必須能夠開放獲取商業(yè) AI 模型所依賴的技術(shù)和代碼。“即使是最好的專家,也沒法看一眼復(fù)雜的神經(jīng)網(wǎng)絡(luò),就弄清楚它到底是如何工作的。”Hoos 說。“我們對這些系統(tǒng)的能力和局限性知之甚少,因此,我們必須盡可能多地了解它們的創(chuàng)建方式。” Theis 說,許多公司正在努力開放他們的 AI 模型,因為他們希望更多的人能夠使用它們。“讓人們接受工具培訓(xùn)是行業(yè)的核心利益。”他說。例如,F(xiàn)acebook 的母公司 Meta 一直在推動更多開放模型,因為它希望更好地與 OpenAI 和谷歌等公司競爭。科羅拉多大學(xué)博爾德分校的計算機(jī)科學(xué)家 Daniel Acua 說,讓人們訪問其模型將帶來新的、富有創(chuàng)意的想法。但Hoos表示,期望公司泄露所有“秘密配方”是不現(xiàn)實的,這也是另一方面的原因,需要學(xué)術(shù)界保持技術(shù)和人才能力跟上行業(yè)發(fā)展。
互惠互利
并非所有人都過于擔(dān)心行業(yè)主導(dǎo)人工智能開發(fā)的部分,一部分人希望學(xué)術(shù)界和企業(yè)能夠找到平衡點(diǎn)。Theis 說:“必須明確的是,產(chǎn)業(yè)和學(xué)術(shù)界深度參與人工智能研究對雙方都有好處。”
學(xué)者們可以自由地追求意想不到或高風(fēng)險的研究方向,而公司則能從中受益這可能會帶來新的突破,解決其產(chǎn)品面臨的一些問題。“如果不采用完全不同的方法,當(dāng)前人工智能工具的一些局限性可能無法克服。” Vallor說。而那些不太關(guān)心他們的想法是否能轉(zhuǎn)化為成功產(chǎn)品的研究人員,更可能發(fā)現(xiàn)這些方法。
迅猛發(fā)展
自然指數(shù)期刊中人工智能(AI)研究的增長速度非?欤踔猎试S數(shù)據(jù)庫在 2022年擴(kuò)展到健康科學(xué)領(lǐng)域。例如,從 2019 年到 2021 年,中國的人工智能份額增長了一倍多。美國和中國之間的差距也在迅速縮校
至于學(xué)者,盡管他們可以自由地從事好奇心驅(qū)動的項目,但他們也可以從行業(yè)獲得知識和支持,幫助他們解決有趣而棘手的問題。“我和其他實驗室的實習(xí)生去大型科技公司或制藥公司學(xué)習(xí)行業(yè)經(jīng)驗是很常見的,”Theis 說。“兩者之間實際上存在不斷來回的交流和傳播。”
Acua 和他的同事研究了行業(yè)和學(xué)術(shù)研究人員對人工智能的不同方法3。他們分析了 1995 年至 2020 年期間在各種人工智能會議上發(fā)表的論文,以了解研究團(tuán)隊的組成與其工作的新穎性的關(guān)系,及其對引用和模型創(chuàng)建方面的影響。
他們發(fā)現(xiàn),完全由行業(yè)研究人員組成的團(tuán)隊的工作往往被引用率更高,并產(chǎn)生最先進(jìn)的模型。相比之下,學(xué)術(shù)團(tuán)隊往往產(chǎn)生更新穎的工作,他們的論文更有可能包含非常規(guī)和非典型的想法。有趣的是,學(xué)術(shù)-行業(yè)合作往往與行業(yè)團(tuán)隊的結(jié)果相似,致力于解決能夠大量被引用的困難工程問題,但失去了學(xué)術(shù)項目標(biāo)志性的新穎性。
這種分工在許多其他科學(xué)領(lǐng)域都很常見,這就是為什么Acua說他比其他人更看好學(xué)術(shù)界人工智能研究的未來。即使學(xué)者們沒有足夠的資源或計算能力來構(gòu)建最大的大型語言模型,他們也有能力做更新、更具突破性的工作。“放肆一點(diǎn)好了,”他說。“不要因為你身處學(xué)術(shù)界而輕視某個領(lǐng)域,你有自由去做任何你想做的事。”
與產(chǎn)業(yè)界同步
然而,為了最大限度地利用這種自由,學(xué)者們需要支持最重要的是資金支持。“要有更大力廣泛地投資基礎(chǔ)研究,這樣的研究方不至于應(yīng)者寥寥、曇花一現(xiàn)。”Theis 說。
盡管政府不太可能匹敵行業(yè)投入的巨額資金,但規(guī)模較孝更集中的投資可以產(chǎn)生巨大影響。“加拿大的人工智能戰(zhàn)略并沒有花費(fèi)大量資金,但卻非常有效,”Hoos 說。自 2016 年以來,該國已在人工智能計劃上投資了約 20 億加元(14.6 億美元),并于 2024 年宣布計劃在未來幾年內(nèi)再投入 24 億加元。其中大部分資金專門用于為大學(xué)研究人員提供人工智能應(yīng)用所需的計算能力,支持負(fù)責(zé)任的人工智能研究,以及招募和留住頂尖人才。這一戰(zhàn)略幫助加拿大在學(xué)術(shù)研究和商業(yè)開發(fā)方面取得了超乎尋常的成就,并在全球排名榜上保持領(lǐng)先地位。2023 年,加拿大在人工智能研究自然指數(shù)產(chǎn)出排名中位居世界第 7 位,在自然科學(xué)領(lǐng)域總體排名第 9 位。
人工智能領(lǐng)域十大新興機(jī)構(gòu)
德國亥姆霍茲研究中心聯(lián)合會,是自然指數(shù)中人工智能研究產(chǎn)出增幅最大的機(jī)構(gòu)之一,該聯(lián)合會設(shè)立了一個專門部門,為在工作中使用人工智能的研究人員提供專業(yè)知識和資金。
加拿大卓越研究主席計劃等招聘計劃為各個領(lǐng)域的頂尖研究人員提供為期八年、高達(dá) 800 萬加元的資助,以吸引他們移居或留在加拿大;德國的亞歷山大馮洪堡人工智能教授職位為期五年,提供 500 萬歐元,這兩項計劃都有助于鞏固這些國家的人工智能研究。Hoos本人就擁有一個洪堡教授職位。
歐洲還推出了多項旨在促進(jìn)人工智能學(xué)術(shù)研究的計劃。Theis是亥姆霍茲人工智能計劃的科學(xué)總監(jiān)。該計劃由德國亥姆霍茲研究中心亥姆霍茲聯(lián)合會運(yùn)營,為研究實驗室提供資金、計算訪問和咨詢,幫助他們將人工智能工具應(yīng)用于工作,例如尋找新方法利用他們在藥物發(fā)現(xiàn)和氣候建模等領(lǐng)域產(chǎn)生的大型數(shù)據(jù)集。Theis說:“我們希望通過民主化訪問人工智能,為研究人員提供支持。真正加速這些研究實驗室的發(fā)展。”
歐洲人工智能研究實驗室聯(lián)盟 CLAIRE 提出了一項更加雄心勃勃的計劃,該聯(lián)盟由 Hoos 于 2018 年與他人共同創(chuàng)立。該計劃的靈感來自物理科學(xué)中跨機(jī)構(gòu)甚至跨國家共享大型昂貴設(shè)施的方法。“我們的粒子物理學(xué)家朋友找對了路。”Hoos 說。“他們用公共資金建造了大型機(jī)器。”
Hoos 和他在 CLAIRE 的同事提出了一項“登月計劃”,旨在建立一個設(shè)施,為學(xué)術(shù)科學(xué)家提供必要的計算基礎(chǔ)設(shè)施,使他們在人工智能研究方面跟上產(chǎn)業(yè)界的步伐有點(diǎn)像人工智能領(lǐng)域的 CERN(位于瑞士日內(nèi)瓦附近的粒子物理實驗室)。他們估計,該項目將在六年內(nèi)需要?dú)W盟提供約 1000 億歐元的資金,Hoos 說,與最初的登月計劃美國宇航局的阿波羅太空計劃(以今天的貨幣計算,耗資約 2400 億歐元)以及 CERN 本身的成本相比,這個數(shù)額相當(dāng)合理。他說,這樣的設(shè)施將用于“公開”進(jìn)行人工智能研究,而不是在私人公司實驗室進(jìn)行,從而使研究對公眾完全透明。他說,就像阿波羅計劃和 CERN 一樣,它將給社會和工業(yè)帶來巨大利益。
Vallor 表示,無論采取何種方法,讓公共資助的獨(dú)立學(xué)術(shù)研究人員站在人工智能進(jìn)步的最前沿對于該技術(shù)的安全發(fā)展至關(guān)重要。“如果人工智能被濫用、如果沒有正確的監(jiān)管治理、如果沒有以負(fù)責(zé)任的方式開發(fā),它有可能非常危險。”她說。“我們理應(yīng)擔(dān)憂任何以商業(yè)激勵作為唯一‘舵手’的人工智能生態(tài)系統(tǒng)。”
Brian Owens是加拿大新不倫瑞克省的自由撰稿人。
1. Ahmed, N., Wahed, M. & Thompson, N. C. Science 379, 884886 (2023).
原文以Rage against machine learning driven by profit為標(biāo)題發(fā)布在2024年9月18日出版的《自然》增刊“自然指數(shù)-人工智能”上。
nature