展會(huì)信息港展會(huì)大全

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加。∪狈ε袛嗔⒈惶蕴
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-12-03 10:37:33   瀏覽:89次  

導(dǎo)讀:新智元報(bào)道編輯:靜音澤正【新智元導(dǎo)讀】MIT的76頁(yè)深度報(bào)告!AI輔助創(chuàng)新顯著增長(zhǎng)這毋庸置疑。但,值得注意的是,AI加劇了不同水平科學(xué)家產(chǎn)出的差異,這與科學(xué)家的判斷力強(qiáng)相關(guān),意味著缺乏判斷力的科學(xué)家在未來可能會(huì)被慢慢淘汰……此外,作者還發(fā)現(xiàn),AI雖然提升了效率,但因?yàn)榘哉剂搜芯恐袆?chuàng)意生成的部分,剝奪了科學(xué)家們?cè)谘芯抗ぷ髦械臉啡。AI的最新進(jìn)展顯示出幫助科學(xué)突破 ......

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加劇!缺乏判斷力將被淘汰

新智元報(bào)道

編輯:靜音澤正【新智元導(dǎo)讀】MIT的76頁(yè)深度報(bào)告!AI輔助創(chuàng)新顯著增長(zhǎng)這毋庸置疑。但,值得注意的是,AI加劇了不同水平科學(xué)家產(chǎn)出的差異,這與科學(xué)家的判斷力強(qiáng)相關(guān),意味著缺乏判斷力的科學(xué)家在未來可能會(huì)被慢慢淘汰……此外,作者還發(fā)現(xiàn),AI雖然提升了效率,但因?yàn)榘哉剂搜芯恐袆?chuàng)意生成的部分,剝奪了科學(xué)家們?cè)谘芯抗ぷ髦械臉啡ぁ?strong style="margin:0px;max-width:100%;outline:0px;padding:0px;visibility:visible;box-sizing:border-box !important;overflow-wrap:break-word !important">AI的最新進(jìn)展顯示出幫助科學(xué)突破的潛力,尤其是在藥物發(fā)現(xiàn)和材料科學(xué)等領(lǐng)域。來自MIT的Aidan最近發(fā)布了一篇長(zhǎng)達(dá)76頁(yè)的深度研究報(bào)告,內(nèi)容關(guān)于AI對(duì)科學(xué)發(fā)現(xiàn)和產(chǎn)品創(chuàng)新的影響。通過分析一家美國(guó)大型企業(yè)研發(fā)部門引入AI技術(shù)前后的情況,研究發(fā)現(xiàn),在AI輔助下,科學(xué)家們發(fā)現(xiàn)新材料的數(shù)量增加了44%,這些新材料具有更獨(dú)特的化學(xué)結(jié)構(gòu),導(dǎo)致專利申請(qǐng)數(shù)量增加39%,下游產(chǎn)品的創(chuàng)新率上升17%!MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加。∪狈ε袛嗔⒈惶蕴

論文地址:https://conference.nber.org/conf_papers/f210475.pdf雖然AI的應(yīng)用顯著提高了研發(fā)效率,但其效果在不同能力水平的科學(xué)家之間存在巨大差異,頂尖研究人員的產(chǎn)出近乎翻倍,而底部三分之一的科學(xué)家受益較少。深入分析這些結(jié)果的機(jī)制表明,AI自動(dòng)化了57%的「創(chuàng)意生成」任務(wù),使研究人員能夠?qū)⒕χ匦路峙涞皆u(píng)估AI生成的候選材料上。頂尖科學(xué)家利用他們的領(lǐng)域知識(shí)來優(yōu)先考慮有前景的AI建議,而其他人則浪費(fèi)了大量資源在測(cè)試錯(cuò)誤的結(jié)果上。此外,調(diào)查還顯示,雖然AI技術(shù)提高了科學(xué)家的工作效率,但也帶來了工作滿意度下降的問題,有82%的科學(xué)家表示工作滿意度降低,主要原因是技能未得到充分利用和創(chuàng)造力的減少。盡管如此,參與實(shí)驗(yàn)的科學(xué)家普遍增加了對(duì)AI技術(shù)能增強(qiáng)生產(chǎn)力的信心,并有較大比例計(jì)劃提升相關(guān)技能以適應(yīng)未來工作的需求。研究背景

目前AI4Science已經(jīng)如火如荼。最新的諾貝爾物理與化學(xué)獎(jiǎng)也頒發(fā)給了AI,這說明AI有望帶來科學(xué)突破,尤其是在藥物發(fā)現(xiàn)和材料科學(xué)等領(lǐng)域,因?yàn)檫@些領(lǐng)域的模型可以在現(xiàn)有實(shí)例的大型數(shù)據(jù)集上進(jìn)行訓(xùn)練。

然而,人們對(duì)這些工具在現(xiàn)實(shí)世界中如何有效地深度參與到研發(fā)流程卻知之甚少,研發(fā)瓶頸、組織內(nèi)部沖突或缺乏可靠性都會(huì)限制它們的有效性。因此,AI對(duì)創(chuàng)新速度和方向的影響仍不確定。為了研究這些問題,論文作者Aidan在美國(guó)一家大型公司的研發(fā)實(shí)驗(yàn)室向1018名科學(xué)家隨機(jī)引入了一種用于材料發(fā)現(xiàn)的AI工具。該實(shí)驗(yàn)室專注于材料科學(xué)在醫(yī)療保健、光學(xué)和工業(yè)制造領(lǐng)域的應(yīng)用,擁有化學(xué)、物理學(xué)和工程學(xué)高級(jí)學(xué)位的研究人員。傳統(tǒng)上,科學(xué)家們通過昂貴而耗時(shí)的試錯(cuò)系統(tǒng)來發(fā)現(xiàn)材料,構(gòu)思出許多潛在的結(jié)構(gòu)并測(cè)試其特性,就像愛迪生研發(fā)燈泡一樣。而AI模型通過對(duì)現(xiàn)有材料的成分和特性相關(guān)的數(shù)據(jù)進(jìn)行訓(xùn)練,就可以生成預(yù)測(cè)具有特定特性的新型化合物的「配方」。下圖概述了研發(fā)流程。MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加。∪狈ε袛嗔⒈惶蕴

首先,科學(xué)家要定義一組目標(biāo)特性,并為預(yù)測(cè)能滿足這些要求的新化合物提出想法。在引入AI之前,研究人員采用領(lǐng)域知識(shí)與迭代計(jì)算相結(jié)合的方法來進(jìn)行初步設(shè)計(jì)。鑒于預(yù)測(cè)材料特性的難度,這一過程耗費(fèi)大量時(shí)間,而且會(huì)出現(xiàn)許多錯(cuò)誤。然后,科學(xué)家們會(huì)對(duì)這些候選化合物進(jìn)行評(píng)估,并合成最有前景的方案。一旦研究人員發(fā)現(xiàn)可行的材料后,通常會(huì)申請(qǐng)專利,并將其應(yīng)用到產(chǎn)品原型中。這些可能是全新的產(chǎn)品,也可能是對(duì)現(xiàn)有產(chǎn)品線的改進(jìn)。最后,原型被開發(fā)、量產(chǎn)并投放市場(chǎng)。將AI用于科學(xué)一直都有一個(gè)問題,它可能會(huì)放大「路燈效應(yīng)」。也就是說由于模型是在現(xiàn)有知識(shí)的基礎(chǔ)上訓(xùn)練出來的,它們很可能會(huì)將搜索方向引向人們熟知但價(jià)值較低的領(lǐng)域。但是事實(shí)與這一假設(shè)恰恰相反,研究發(fā)現(xiàn)AI在研發(fā)的全鏈路都提高了創(chuàng)新性。首先是與現(xiàn)有化合物相比,模型生成的材料具有更獨(dú)特的物理結(jié)構(gòu),這表明AI釋放了新的設(shè)計(jì)空間。其次,利用AI工具的科學(xué)家申請(qǐng)的專利更有可能引入新的技術(shù)術(shù)語(yǔ)(這是變革性技術(shù)的主要指標(biāo)),產(chǎn)生更有創(chuàng)造性的發(fā)明。第三,它提高了代表新產(chǎn)品線所占的比例,而非只是去改進(jìn)現(xiàn)有產(chǎn)品線,這些都促進(jìn)了研發(fā)向更加創(chuàng)新的方向不斷前進(jìn)。測(cè)量策略及研究設(shè)計(jì)

作者將材料發(fā)現(xiàn)過程分為三類任務(wù):創(chuàng)意生成、判斷和實(shí)驗(yàn)。

創(chuàng)意的產(chǎn)生包括與開發(fā)潛在化合物相關(guān)的活動(dòng),如查閱現(xiàn)有材料的文獻(xiàn)或進(jìn)行初步設(shè)計(jì)。判斷任務(wù)的重點(diǎn)是選擇要推進(jìn)的化合物,通常涉及模擬分析或根據(jù)領(lǐng)域知識(shí)預(yù)測(cè)材料特性。最后,實(shí)驗(yàn)任務(wù)致力于合成新材料并進(jìn)行測(cè)試以評(píng)估其特性。發(fā)現(xiàn)一種材料后,科學(xué)家通常會(huì)申請(qǐng)專利。這可能涉及單一化合物、化合物組合或使用這些化合物的新技術(shù)。專利需要滿足三個(gè)標(biāo)準(zhǔn):新穎性、實(shí)用性和非顯而易見性。因此,專利標(biāo)志著科學(xué)發(fā)現(xiàn)轉(zhuǎn)化為有用發(fā)明的研究階段。專利申請(qǐng)通常需要兩年時(shí)間才能獲得批準(zhǔn),因此該論文研究的分析重點(diǎn)是專利申請(qǐng)。材料發(fā)現(xiàn)因其復(fù)雜性而極具挑戰(zhàn)性。合理的化學(xué)構(gòu)型空間巨大,需要科學(xué)家探索許多潛在的化合物。此外,雖然原子鍵的特性眾所周知,但很難預(yù)測(cè)它們聚合成大規(guī)模特征的模式。擅長(zhǎng)從復(fù)雜數(shù)據(jù)中提取特征的深度學(xué)習(xí)模型有可能克服這些挑戰(zhàn)。近年來,匯集已知化合物結(jié)構(gòu)和特征的大型標(biāo)準(zhǔn)化數(shù)據(jù)庫(kù)激增。加上算法的進(jìn)步和計(jì)算能力的提高,這大大提高了深度學(xué)習(xí)在材料科學(xué)領(lǐng)域的性能。因此,該領(lǐng)域?qū)@些技術(shù)的興趣迅速增長(zhǎng)。MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

該實(shí)驗(yàn)室的AI技術(shù)是一套根據(jù)現(xiàn)有材料的結(jié)構(gòu)和特性訓(xùn)練而成的圖神經(jīng)網(wǎng)絡(luò)(GNN)。MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

這張圖展示了實(shí)驗(yàn)室AI工具的結(jié)構(gòu)。圖A逆向材料設(shè)計(jì)表示了圖神經(jīng)網(wǎng)絡(luò)輸入一組目標(biāo)特征并輸出一個(gè)預(yù)測(cè)的結(jié)構(gòu)。圖B展示了三步驟的模型訓(xùn)練:首先基于已知材料的結(jié)構(gòu)進(jìn)行預(yù)訓(xùn)練,再基于材料屬性針對(duì)特定應(yīng)用進(jìn)行微調(diào),最后結(jié)合科學(xué)家對(duì)AI生成的化合物的實(shí)驗(yàn)進(jìn)行強(qiáng)化學(xué)習(xí)。圖C是圖擴(kuò)散模型的結(jié)構(gòu),該模型采用了一種基于擴(kuò)散的方法來生成新的材料。它從一個(gè)已知的結(jié)構(gòu)開始,增加噪音,然后逆轉(zhuǎn)這個(gè)過程來創(chuàng)建一個(gè)新的化合物。在短期試點(diǎn)計(jì)劃之后,實(shí)驗(yàn)室于2022年5月開始大規(guī)模推廣將該AI工具與研究結(jié)合的模式。他們將研究人員團(tuán)隊(duì)隨機(jī)分配到三個(gè)批次中,分別由404、419和195名科學(xué)家組成。時(shí)間間隔約為六個(gè)月。在每一輪開始時(shí),研究人員都會(huì)參加一個(gè)培訓(xùn)項(xiàng)目,學(xué)習(xí)如何使用該技術(shù)。研究將多個(gè)數(shù)據(jù)源結(jié)合起來,以詳細(xì)描述研發(fā)過程。作者收集了候選化合物、合成物質(zhì)和最終材料的數(shù)據(jù)。這些數(shù)據(jù)包括化合物的物理結(jié)構(gòu)信息,即其原子和化學(xué)鍵的組成和幾何方向。此外,他還會(huì)觀察材料特性測(cè)試的結(jié)果,提供大量原子和宏觀尺度的特性。一旦新材料被添加到實(shí)驗(yàn)室內(nèi)部的化合物數(shù)據(jù)庫(kù)中,并被認(rèn)為可以用于產(chǎn)品,作者就會(huì)將其歸類為「發(fā)現(xiàn)」的材料。這標(biāo)志著從科學(xué)到工程的過渡,之后材料將被大規(guī)模開發(fā)和生產(chǎn)。作者還將新材料與專利申請(qǐng)相匹配。這既包括化合物本身的專利,也包括使用這些化合物的技術(shù)。專利數(shù)據(jù)之所以有用,有兩個(gè)原因。首先,專利可以鑒定發(fā)明是重大的、適用的突破。其次,通過專利的申請(qǐng)文本,就可以使用相似度量來評(píng)估發(fā)明的新穎性,即利用術(shù)語(yǔ)頻率向量之間的余弦相似性來量化文本相似性。專利新穎性的第二個(gè)衡量標(biāo)準(zhǔn)是新技術(shù)術(shù)語(yǔ)的引入。剔除非技術(shù)術(shù)語(yǔ)后,它將專利的新穎性定義為在以前的專利中沒有出現(xiàn)過的詞組所占的比例。正如Kalyani所指出的,這是衡量變革性技術(shù)的領(lǐng)先指標(biāo)。研究發(fā)現(xiàn)在經(jīng)過AI工具輔助后新申請(qǐng)的專利平均包含544個(gè)技術(shù)詞組。其中,6.28%被歸類為新術(shù)語(yǔ)。為了評(píng)估下游創(chuàng)新,作者收集了包含新發(fā)現(xiàn)材料的產(chǎn)品數(shù)據(jù)。其中主要是材料的使用方式,以及產(chǎn)品是代表新產(chǎn)品線還是對(duì)現(xiàn)有產(chǎn)品線的改進(jìn)。材料發(fā)現(xiàn)、專利申請(qǐng)及產(chǎn)品創(chuàng)新

數(shù)量顯著增長(zhǎng)作者首先通過描述性證據(jù)展示了AI在材料發(fā)現(xiàn)、專利申請(qǐng)和產(chǎn)品創(chuàng)新方面的影響。下圖顯示了采用AI和未采用AI進(jìn)行研究的科學(xué)家在新材料、專利申請(qǐng)、新產(chǎn)品原型三個(gè)方面的時(shí)間序列趨勢(shì),揭示了采用AI后新化合物和專利申請(qǐng)數(shù)量的顯著增長(zhǎng)。十到十二個(gè)月后,采用AI所發(fā)現(xiàn)化合物的產(chǎn)品原型也隨之增加。MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

接下來,作者轉(zhuǎn)向回歸估計(jì)。下圖展示了樣本最后五個(gè)月的終線處理效應(yīng)。平均來看,采用AI輔助研究的科學(xué)家發(fā)現(xiàn)的材料多出44%,帶來專利申請(qǐng)?jiān)黾?9%,產(chǎn)品原型增加17%。MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加劇!缺乏判斷力將被淘汰

為了研究動(dòng)態(tài)效果,下圖展示了事件研究的估計(jì)結(jié)果。結(jié)果顯示出與原始時(shí)間序列相似的模式:材料發(fā)現(xiàn)和專利申請(qǐng)的影響在5到6個(gè)月后出現(xiàn),而產(chǎn)品創(chuàng)新的影響則滯后一年多。MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加劇!缺乏判斷力將被淘汰

這些影響是巨大的。從材料發(fā)現(xiàn)增加的角度來看,實(shí)驗(yàn)室每位科學(xué)家的研究成果在過去五年中下降了4%。盡管引入了一些旨在幫助科學(xué)家的計(jì)算工具,但情況還是如此。因此,AI似乎是一種與眾不同的技術(shù),其影響要比以前的輔助研究方法大得多。材料質(zhì)量有所提高AI增加了新化合物的數(shù)量。然而,這可能會(huì)同時(shí)降低材料質(zhì)量。為了驗(yàn)證這一觀點(diǎn),作者使用材料特性測(cè)試質(zhì)量。如下表所示,他基于科學(xué)家目標(biāo)特性與化合物實(shí)際特性之間的距離構(gòu)建了三個(gè)質(zhì)量指數(shù)。MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

上表顯示了AI對(duì)這些指標(biāo)的影響。對(duì)于原子特性,該工具將平均質(zhì)量提高了13%,并將前10%材料的比例提高了1.7個(gè)百分點(diǎn)(第1-2列);大規(guī)模特性的影響相似但略。ǖ3-4列)。第5和6列將這兩組特性組合為總體指數(shù),顯示平均質(zhì)量顯著提高(9%),高質(zhì)量材料的比例增加了1.5個(gè)百分點(diǎn)。這些指數(shù)組合了對(duì)公司可能具有不同重要性的多個(gè)特性,因此難以準(zhǔn)確解釋這些估計(jì)值的規(guī)模。然而,結(jié)果表明,AI輔助的材料發(fā)現(xiàn)并未以犧牲質(zhì)量為代價(jià)。AI工具對(duì)于創(chuàng)新的具體影響AI工具增加了研發(fā)中三個(gè)階段的新穎性。MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加。∪狈ε袛嗔⒈惶蕴

首先,按照化學(xué)相似性方法來衡量新材料本身的新穎性時(shí),如上表第1列所示,AI使平均相似度降低了0.4個(gè)標(biāo)準(zhǔn)差。此外,AI還使高度獨(dú)特材料的比例增加了4個(gè)百分點(diǎn)(見第2列)。通過對(duì)科學(xué)家的調(diào)查證實(shí)了這些測(cè)量結(jié)果。73%的研究人員表示,AI工具比其他方法產(chǎn)生了更多新穎的設(shè)計(jì)。雖然化學(xué)相似性捕捉到了科學(xué)新穎性的一個(gè)關(guān)鍵方面,但重要的是要確定更多的原創(chuàng)材料是否會(huì)帶來更多的創(chuàng)新技術(shù)。然后作者利用兩個(gè)相似度指標(biāo)分析了專利申請(qǐng)的文本相似性。第一個(gè)指標(biāo)基于申請(qǐng)全文,第二個(gè)指標(biāo)基于新技術(shù)術(shù)語(yǔ)的比例。如上表第3列所示,該工具將第一個(gè)指標(biāo)的新穎性提高了11%,使平均申請(qǐng)量從相似性分布的第48百分位數(shù)上升到第42百分位數(shù)。在第二項(xiàng)指標(biāo)上(見第4列),AI將新技術(shù)術(shù)語(yǔ)的比例提高了兩個(gè)百分點(diǎn)(22%)。最后,作者研究了該工具對(duì)產(chǎn)品創(chuàng)新性質(zhì)的影響。在沒有AI的情況下,科學(xué)家們主要關(guān)注現(xiàn)有產(chǎn)品的改進(jìn),只有13%的原型代表新產(chǎn)品線。如上表第5列所示,這一比例上升了3個(gè)百分點(diǎn)(22%)?傊,AI工具提高了發(fā)現(xiàn)的新穎性,帶來了更多創(chuàng)造性專利和更多創(chuàng)新產(chǎn)品。而AI增加新穎性這一事實(shí)可以有兩種解釋。一種可能是,模型只是善于歸納,探索材料設(shè)計(jì)空間的新部分;蛘撸@一發(fā)現(xiàn)可能主要反映了在沒有AI的情況下人類的局限性,也就是說科學(xué)家們會(huì)更加嚴(yán)格地遵循熟悉的模板與既定流程。AI加劇了科學(xué)家產(chǎn)出的差異

研究表明,AI主要惠及原本生產(chǎn)力就高的科學(xué)家,從而加劇了不平等。下圖展示了引入AI前后材料發(fā)現(xiàn)率的分布。分布向右移動(dòng)且更偏右,表明高能力的科學(xué)家從該工具中獲得了更多收益。

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

下圖展示了回歸估計(jì)結(jié)果,將研究人員是否被分配使用AI工具的狀態(tài)與初始生產(chǎn)力的分位數(shù)相結(jié)合。

結(jié)果表明,處于底部三分之一的研究人員幾乎沒有從該工具中受益,而最高分位的科學(xué)家產(chǎn)出增加了81%。因此,90:10研究表現(xiàn)的比率增加了一倍以上。足以說明,這一工具加劇了不平等的現(xiàn)象。

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

核心要素:科學(xué)家的判斷能力材料發(fā)現(xiàn)涉及三個(gè)任務(wù)階段:創(chuàng)意生成、判斷(即識(shí)別出有前景的候選化合物的能力)和實(shí)驗(yàn)。生產(chǎn)力的差異反映了科學(xué)家在各階段中的不同能力。

首先,作者設(shè)計(jì)了一個(gè)方法,用于估算每位科學(xué)家在預(yù)處理期內(nèi)的任務(wù)特定研究能力。由于實(shí)驗(yàn)階段僅包含例行測(cè)試,他將重點(diǎn)放在創(chuàng)意生成和判斷上。

作者進(jìn)行了多項(xiàng)測(cè)試來驗(yàn)證這些能力測(cè)量。最后得到如下圖表:

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

上圖顯示了科學(xué)家在創(chuàng)意生成和判斷兩方面技能的相關(guān)性。這兩個(gè)指標(biāo)之間呈正相關(guān)(r=0.42, p

但關(guān)聯(lián)度遠(yuǎn)低于1。這表明,雖然一些科學(xué)家在這兩項(xiàng)任務(wù)上都表現(xiàn)較好,但他們不一定在兩者上都同樣出色。這種較低的相關(guān)性揭示了每個(gè)科學(xué)家在不同任務(wù)上可能具有「比較優(yōu)勢(shì)」,即一些科學(xué)家在「創(chuàng)意生成」方面更擅長(zhǎng),而另一些人在「判斷」方面表現(xiàn)更佳。因此,科學(xué)家可以通過發(fā)揮自己在特定任務(wù)上的優(yōu)勢(shì)來實(shí)現(xiàn)專業(yè)化。

所以,不能簡(jiǎn)單地將「技能偏向」看作一維的。要更細(xì)致地理解AI在科學(xué)研究中所補(bǔ)充的技能,必須關(guān)注科學(xué)家在不同任務(wù)中的具體能力。

這意味著,AI并不是對(duì)所有科學(xué)技能都有幫助,而是特別能加強(qiáng)那些能與AI合作或被AI支持的特定技能,比如判斷能力。在研究中探索這些不同的技能有助于更好地理解人類和AI如何協(xié)同工作。

在獲得任務(wù)特定的研究能力估計(jì)后,作者研究了哪些技能導(dǎo)致了AI的異質(zhì)性影響。為此,作者在科學(xué)家層面估計(jì)了一個(gè)回歸模型:

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

其中,yst是科學(xué)家s在月t內(nèi)發(fā)現(xiàn)的材料數(shù)量,Dst是一個(gè)表示是否受到AI影響的處理指示變量,MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加劇!缺乏判斷力將被淘汰

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

分別表示科學(xué)家在創(chuàng)意生成和判斷任務(wù)上的估計(jì)研究能力。這些能力測(cè)量標(biāo)準(zhǔn)化為均值為零、標(biāo)準(zhǔn)差為一。主要關(guān)注的系數(shù)是β4和β5,它們捕捉了AI對(duì)任務(wù)特定技能的差異性影響。

得到的結(jié)果如下表。當(dāng)MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加劇!缺乏判斷力將被淘汰

增加一個(gè)標(biāo)準(zhǔn)差時(shí),AI處理效應(yīng)提升了14.8個(gè)百分點(diǎn);而MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

增加相同幅度僅導(dǎo)致3.5個(gè)百分點(diǎn)的提升。兩個(gè)交互項(xiàng)的系數(shù)均為正且顯著,但判斷任務(wù)的影響明顯更大。

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加劇!缺乏判斷力將被淘汰

判斷能力差異解釋了AI對(duì)初始生產(chǎn)力異質(zhì)性影響的80%以上。這些發(fā)現(xiàn)表明,在解釋AI對(duì)不同科學(xué)家影響的差異時(shí),判斷能力起到了核心作用。

科學(xué)家與AI的協(xié)作

經(jīng)過上面的研究,作者總結(jié)出了以下三點(diǎn)發(fā)現(xiàn):首先,AI顯著提高了材料發(fā)現(xiàn)的平均速度;其次,它對(duì)初始生產(chǎn)力水平不同的科學(xué)家產(chǎn)生了不成比例的好處;第三,這種異質(zhì)性幾乎完全由科學(xué)家的判斷能力的差異所驅(qū)動(dòng)。為了解這些結(jié)果背后的機(jī)制,作者研究了科研中科學(xué)家與AI的協(xié)作機(jī)制。

創(chuàng)意生成時(shí)間被大大壓縮首先,他記錄了AI加入前后科學(xué)家工作精力分配的比例變化。

下圖展示了科學(xué)家在研究過程中分配到創(chuàng)意生成、判斷和實(shí)驗(yàn)任務(wù)上的時(shí)間份額變化。這些數(shù)據(jù)來源于科學(xué)家的活動(dòng)日志。

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加。∪狈ε袛嗔⒈惶蕴

由此可見,在引入AI之前,科學(xué)家將39%的時(shí)間用于創(chuàng)意生成,但在模型引入后,這一比例降至16%以下。同時(shí),判斷任務(wù)所占時(shí)間從最初的23%增加到了樣本結(jié)束時(shí)的40%。實(shí)驗(yàn)任務(wù)的時(shí)間份額也從37%增加到44%。另外,研究總時(shí)長(zhǎng)保持不變。

下圖展示了在判斷任務(wù)上具有較大比較優(yōu)勢(shì)的科學(xué)家(即高MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加劇!缺乏判斷力將被淘汰

/MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

值)和較小比較優(yōu)勢(shì)的科學(xué)家在任務(wù)構(gòu)成上的變化。

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加劇!缺乏判斷力將被淘汰

雖然所有科學(xué)家的時(shí)間分配都發(fā)生了顯著調(diào)整,但相比其他科學(xué)家,那些在判斷技能方面具有比較優(yōu)勢(shì)的科學(xué)家將更多的工作時(shí)間從創(chuàng)意生成任務(wù)轉(zhuǎn)移到了判斷任務(wù)上。具體而言,這些科學(xué)家在時(shí)間分配上的轉(zhuǎn)變比判斷技能較弱的科學(xué)家多了46%。

判斷力來自領(lǐng)域知識(shí)接下來,作者建立了一個(gè)簡(jiǎn)單的優(yōu)先搜索框架來分析這種轉(zhuǎn)變背后的原因。

他發(fā)現(xiàn)判斷力強(qiáng)的科學(xué)家測(cè)試的候選材料數(shù)量較少,但發(fā)現(xiàn)的可行化合物更多。具有較強(qiáng)判斷力的科學(xué)家學(xué)會(huì)了優(yōu)先選擇有前景的AI建議,而其他人則在測(cè)試錯(cuò)誤建議上浪費(fèi)了大量資源。這導(dǎo)致的發(fā)現(xiàn)率差距解釋了工具的異質(zhì)性影響。

此外,作者還發(fā)現(xiàn),在引入AI后,科學(xué)家在評(píng)估AI生成的化合物方面的能力差異逐漸顯現(xiàn)并擴(kuò)大。

對(duì)比后發(fā)現(xiàn),判斷力較強(qiáng)的科學(xué)家在處理期內(nèi)迅速提高了他們對(duì)AI建議的排序和優(yōu)先級(jí)設(shè)置,而判斷力較弱的科學(xué)家在評(píng)估上未見明顯改善。

這個(gè)能力差距導(dǎo)致頂尖評(píng)估者能夠有效地篩選出更多高質(zhì)量的化合物,而評(píng)估能力較弱者則在篩選上表現(xiàn)接近隨機(jī)。

為了探索為何部分科學(xué)家的判斷力更優(yōu),作者設(shè)計(jì)了一份問卷調(diào)查實(shí)驗(yàn)室的科學(xué)家們,以了解他們?cè)谠u(píng)估過程中的想法和經(jīng)驗(yàn)。

調(diào)查數(shù)據(jù)顯示,這些判斷力上的差異主要來自科學(xué)家的領(lǐng)域知識(shí)。

進(jìn)一步分析中,作者考察了四種可能的專家能力來源。

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

結(jié)果如上圖所示,高判斷能力的研究人員在評(píng)估模型生成的候選物時(shí)更重視科學(xué)訓(xùn)練和類似材料的經(jīng)驗(yàn)。

此外,他們的「直覺或第六感」也與判斷能力呈正相關(guān)(直覺被視為隱性知識(shí)的代表)。

然而,AI技術(shù)的使用經(jīng)驗(yàn)對(duì)這種差異沒有解釋力,因?yàn)樗锌茖W(xué)家報(bào)告的此前接觸AI的經(jīng)驗(yàn)都較少。

與此一致的是,判斷能力的差異隨著時(shí)間逐漸顯現(xiàn)。支持領(lǐng)域知識(shí)重要性的證據(jù)表明,處于判斷能力上四分位數(shù)的科學(xué)家發(fā)表與其研究材料相關(guān)學(xué)術(shù)論文的概率是其三倍多。

這些結(jié)果強(qiáng)調(diào)了領(lǐng)域知識(shí)在評(píng)估AI建議時(shí)的重要性。機(jī)器學(xué)習(xí)的視角表明,頂尖科學(xué)家在材料設(shè)計(jì)問題上能夠識(shí)別出模型未捕捉的特征。

因此,將人類反饋納入算法預(yù)測(cè)中可能是科學(xué)發(fā)現(xiàn)的一個(gè)潛在途徑。從經(jīng)濟(jì)學(xué)的角度來看,這些發(fā)現(xiàn)展示了算法與專業(yè)知識(shí)在創(chuàng)新過程中的互補(bǔ)關(guān)系,尤其強(qiáng)調(diào)了「判斷模型建議」這一新研究技能的重要性,這種技能能夠增強(qiáng)AI技術(shù)的效力。

有人曾推測(cè)大數(shù)據(jù)和機(jī)器學(xué)習(xí)會(huì)使領(lǐng)域知識(shí)過時(shí),但在材料科學(xué)領(lǐng)域情況并非如此。事實(shí)上,只有具備足夠?qū)I(yè)知識(shí)的研究人員才能充分發(fā)揮AI技術(shù)的作用。

缺乏判斷力易被淘汰在作者研究的過程中,實(shí)驗(yàn)室通過調(diào)整雇傭和管理來應(yīng)對(duì)研究過程的變化。該公司對(duì)其研究團(tuán)隊(duì)進(jìn)行了重組,解雇了約3%的研究人員,并在此基礎(chǔ)上通過增加招聘進(jìn)一步擴(kuò)大了團(tuán)隊(duì)規(guī)模。

在實(shí)驗(yàn)結(jié)束后,實(shí)驗(yàn)室重新設(shè)計(jì)了其招聘和解聘標(biāo)準(zhǔn),優(yōu)先考慮具備較強(qiáng)判斷力的科學(xué)家。

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加劇!缺乏判斷力將被淘汰

按判斷力四分位數(shù)劃分的解雇或重新分配的概率

實(shí)驗(yàn)室的這種調(diào)整體現(xiàn)了勒沙特利原理(LeChatelier Principle),即隨著時(shí)間推移,實(shí)驗(yàn)室能夠?qū)ぞ弋a(chǎn)生更強(qiáng)烈的反應(yīng),因?yàn)樗梢灾匦聝?yōu)化更多的投入。

作者也指出,由于實(shí)驗(yàn)室的這種組織調(diào)整,AI的長(zhǎng)期影響可能會(huì)被當(dāng)前的估計(jì)低估。這意味著,如果實(shí)驗(yàn)室在招聘和人員配置上逐步適應(yīng)AI輔助的工作模式,AI的影響可能在未來會(huì)更加顯著,從而進(jìn)一步提升研究效率和發(fā)現(xiàn)率。

AI提升了效率,卻剝奪了研究樂趣

通過問卷調(diào)查,作者探討了這些變化對(duì)科學(xué)家工作滿意度和對(duì)人工智能看法的影響。除了直接的福利影響,這些結(jié)果還揭示了AI如何可能影響誰(shuí)會(huì)選擇成為科學(xué)家、他們進(jìn)入哪些研究領(lǐng)域,以及他們傾向于培養(yǎng)的技能。AI對(duì)科學(xué)家工作滿意度的影響可能有不同的表現(xiàn)。一方面,它可能通過提升能力和增加科學(xué)發(fā)現(xiàn)的速度來提高士氣;另一方面,它也可能使工作變得不那么令人愉快,因?yàn)橹攸c(diǎn)轉(zhuǎn)移到了不那么有趣的任務(wù)上。

為調(diào)查這些因素的相對(duì)重要性,作者收集了工作滿意度在三個(gè)方面的變化:生產(chǎn)力變化帶來的影響、任務(wù)重新分配帶來的影響,以及總體影響。

在下圖中,結(jié)果以-10到10的尺度顯示,并按最初生產(chǎn)力的四分位數(shù)進(jìn)行分組。結(jié)果顯示出兩種相反的趨勢(shì):任務(wù)變化帶來的負(fù)面影響,以及生產(chǎn)力提升帶來的大多是正面影響。

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

任務(wù)重新分配的影響在各個(gè)四分位數(shù)中始終為負(fù),從-4.1到-4.8不等。盡管生產(chǎn)力提升帶來的樂趣部分抵消了這一負(fù)面影響,特別是在高能力科學(xué)家中。但總體而言,82%的研究人員的滿意度有所下降。

在下圖中,作者列出了科學(xué)家不喜歡任務(wù)變化的主要原因。最常見的抱怨是技能未被充分利用(73%),其次是任務(wù)變得缺乏創(chuàng)造性且更為重復(fù)(53%)。此外,有21%的科學(xué)家擔(dān)心成果歸屬問題,19%則對(duì)AI工具的復(fù)雜性感到不滿。

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加。∪狈ε袛嗔⒈惶蕴

這些數(shù)據(jù)反映了快速技術(shù)進(jìn)步帶來的適應(yīng)難度。正如一位科學(xué)家所言:「雖然我對(duì)AI工具的表現(xiàn)印象深刻……但我不禁覺得自己多年的教育變得毫無用處。這不是我所受的訓(xùn)練。」

這些結(jié)果對(duì)AI主要會(huì)自動(dòng)化枯燥任務(wù)、讓人類專注于更有價(jià)值活動(dòng)的觀點(diǎn)提出了質(zhì)疑。相反,該工具自動(dòng)化的正是科學(xué)家們最感興趣的任務(wù)為新材料創(chuàng)造想法。

這反映了AI與以往技術(shù)的根本差異。過去的技術(shù)創(chuàng)新主要在處理例行、可編程的任務(wù)方面表現(xiàn)出色,而深度學(xué)習(xí)模型則通過識(shí)別訓(xùn)練數(shù)據(jù)中的模式來生成新穎的輸出。

科學(xué)家們的反饋還表明,組織實(shí)踐會(huì)影響AI帶來的福利效應(yīng)。科學(xué)家不僅關(guān)心自身的生產(chǎn)力,還在意相對(duì)于同事的表現(xiàn)。因此,盡管研究產(chǎn)出有所增加,但處于生產(chǎn)力底部四分位的科學(xué)家對(duì)自己的工作滿意度卻有所下降,這與公司的晉升實(shí)踐相一致,因?yàn)闀x升決策基于相對(duì)績(jī)效。

下圖展示了科學(xué)家們對(duì)五個(gè)AI相關(guān)陳述的認(rèn)同水平在AI引入前后的變化。

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加。∪狈ε袛嗔⒈惶蕴

可見,他們?cè)絹碓较嘈臕I會(huì)提高所在領(lǐng)域的生產(chǎn)力。對(duì)于AI取代崗位的擔(dān)憂則基本保持穩(wěn)定,這可能反映了人類判斷力的持續(xù)需求。

此外,科學(xué)家們更加認(rèn)為AI將改變他們工作中取得成功所需的技能,因此,計(jì)劃重新學(xué)習(xí)新技能的研究人員數(shù)量顯著增加。

最后,科學(xué)家們對(duì)自己所選領(lǐng)域的滿意度有所下降,這與前面發(fā)現(xiàn)的工作滿意度下降一致。

作者簡(jiǎn)介

MIT 76頁(yè)深度報(bào)告:AI加速創(chuàng)新馬太效應(yīng),科學(xué)家產(chǎn)出分化加!缺乏判斷力將被淘汰

Aidan Toner-Rodgers是麻省理工學(xué)院經(jīng)濟(jì)學(xué)二年級(jí)博士生。之前,他從麥卡利斯特學(xué)院畢業(yè)后曾在紐約聯(lián)儲(chǔ)工作過。

他的研究主要集中在科學(xué)與創(chuàng)新的經(jīng)濟(jì)學(xué),運(yùn)用產(chǎn)業(yè)組織、博弈論和勞動(dòng)經(jīng)濟(jì)學(xué)的工具。

參考資料:https://conference.nber.org/conf_papers/f210475.pdf

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實(shí)驗(yàn)室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動(dòng)態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機(jī)會(huì) | 展會(huì)港