劃重點
012024年諾貝爾化學(xué)獎授予了John Jumper、Demis Hassabis和David Baker,以表彰他們開發(fā)可預(yù)測和設(shè)計蛋白質(zhì)結(jié)構(gòu)的計算工具AlphaFold。
02AlphaFold在短短幾年內(nèi)帶來了革命性的變化,使研究人員能夠一鍵輕松解析蛋白質(zhì)結(jié)構(gòu)。
03除此之外,華盛頓大學(xué)的David Baker因在計算蛋白質(zhì)設(shè)計領(lǐng)域的貢獻(xiàn)而獲獎。
04三位獲獎?wù)邔⒎窒?100萬瑞典克朗(約合100萬美元)的獎金。
05目前,AlphaFold已對科學(xué)界產(chǎn)生了全面影響,引領(lǐng)醫(yī)學(xué)領(lǐng)域的變革。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
原文作者:Ewen Callaway
今年的獎項表彰了改變生物學(xué)發(fā)展,并且有潛力為藥物開發(fā)帶來新一輪革命的計算工具。
David Baker, Demis Hassabis和John Jumper(從左至右)因開發(fā)可被用于預(yù)測和設(shè)計蛋白質(zhì)結(jié)構(gòu)的計算工具被授予諾貝爾化學(xué)獎。來源: BBVA Foundation
歷史上首次(可能不是最后一次),由人工智能(AI)實現(xiàn)的科學(xué)突破獲得了諾貝爾獎的認(rèn)可。2024年諾貝爾化學(xué)獎授予了倫敦谷歌DeepMind的John Jumper和Demis Hassabis,以表彰他們開發(fā)出了一個顛覆性的可預(yù)測蛋白質(zhì)結(jié)構(gòu)的AI工具AlphaFold;此外,西雅圖的華盛頓大學(xué)的David Baker也因其在計算蛋白質(zhì)設(shè)計領(lǐng)域的貢獻(xiàn)而獲獎。該領(lǐng)域在近年因為AI技術(shù)而興旺發(fā)展。
“我希望當(dāng)我們回顧AlphaFold時,它將成為第一個證明點,展現(xiàn)出AI加速科學(xué)發(fā)現(xiàn)的不可思議的能力。”Hassabis在10月9日的DeepMind新聞發(fā)布會上說。“這一刻感覺太不真實了。”
AlphaFold問世短短幾年已經(jīng)帶來了革命性的變化。此工具讓研究人員可以一鍵輕松解析蛋白質(zhì)結(jié)構(gòu)(不是所有時候,但大多數(shù)情況下極為精確),并且讓十年前難以想象的實驗變得可能。“這是一場重大革命。”倫敦大學(xué)學(xué)院的計算生物學(xué)家Christine Orengo說道。她的實驗室利用AlphaFold預(yù)測的結(jié)構(gòu)揭示了新的蛋白質(zhì)。
諾貝爾委員會主席、瑞典隆德大學(xué)的納米科學(xué)研究員Heiner Linke在頒獎典禮上說:“長期以來,我們一直夢想能夠通過氨基酸序列來預(yù)測蛋白質(zhì)的三維結(jié)構(gòu)……在數(shù)十年里,這一直被認(rèn)為是不可能的。”而今年的獲獎?wù)?ldquo;破解了這個密碼”。三位獲獎?wù)邔⒎窒?100萬瑞典克朗(約合100萬美元)的獎金。
獲獎的人工智能
DeepMind于2018年首次推出AlphaFold,當(dāng)時該工具贏得了一項兩年一度的蛋白質(zhì)結(jié)構(gòu)預(yù)測競賽,“蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)的關(guān)鍵測試(CASP)”。但真正令生命科學(xué)界震撼的是2020年底發(fā)布的第二代深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)AlphaFold2。在CASP競賽中,許多AlphaFold2的預(yù)測非常準(zhǔn)確,與實驗確定的蛋白質(zhì)結(jié)構(gòu)幾乎難以區(qū)分。
DeepMind的聯(lián)合創(chuàng)始人兼首席執(zhí)行官Hassabis與AlphaFold團(tuán)隊負(fù)責(zé)人Jumper領(lǐng)導(dǎo)了AlphaFold2的開發(fā)。為了預(yù)測蛋白質(zhì)結(jié)構(gòu),這個神經(jīng)網(wǎng)絡(luò)融合了數(shù)十萬種結(jié)構(gòu)和數(shù)百萬種相關(guān)蛋白質(zhì)序列庫的數(shù)據(jù),這些數(shù)據(jù)包含著與它們形狀相關(guān)的信息。
AlphaFold的成功很大程度上得益于蛋白質(zhì)數(shù)據(jù)庫(Protein Data Bank)。這是一個開放資源庫,包含超過20萬種蛋白質(zhì)結(jié)構(gòu),通過X射線晶體學(xué)和冷凍電子顯微鏡等方法確定。Jumper在DeepMind的新聞發(fā)布會上表示:“每當(dāng)我們用多年的努力成果來訓(xùn)練[AlphaFold]時,都令人感到謙卑。每一個數(shù)據(jù)點都是某人多年的心血。”
2021年,DeepMind將AlphaFold2的底層代碼與訓(xùn)練模型所需的數(shù)據(jù)一并免費公開。此外,DeepMind與位于英國欣克斯頓的歐洲分子生物學(xué)實驗室(EMBL)下屬歐洲生物信息學(xué)研究所合作創(chuàng)建了AlphaFold數(shù)據(jù)庫。這個數(shù)據(jù)庫現(xiàn)在包含了基因數(shù)據(jù)庫中每個生物體的幾乎所有蛋白質(zhì)結(jié)構(gòu),總計約2.14億個預(yù)測結(jié)構(gòu)。今年,該公司發(fā)布了第三代AlphaFold,能夠模擬能與蛋白質(zhì)相互作用的其他分子,如藥物。
Jumper、Hassabis及其團(tuán)隊引發(fā)的革命尚處于早期階段,而AlphaFold對科學(xué)的全面影響可能還需要數(shù)年才能顯現(xiàn)。然而這個工具已在幫助科學(xué)家們獲得新的見解。
一個開創(chuàng)性的團(tuán)隊利用該工具及實驗數(shù)據(jù)繪制了細(xì)胞核孔復(fù)合體,這是將分子運輸進(jìn)出細(xì)胞核的最大細(xì)胞結(jié)構(gòu)。去年,有兩個團(tuán)隊深入研究了整個AlphaFold數(shù)據(jù)庫并揭示了蛋白質(zhì)世界的隱秘之地,識別了新的蛋白質(zhì)家族和折疊結(jié)構(gòu),并發(fā)現(xiàn)了生命機器中的意外聯(lián)系。
許多研究人員希望AlphaFold及受其啟發(fā)的其他AI工具將引領(lǐng)醫(yī)學(xué)領(lǐng)域的變革,盡管目前尚不清楚AlphaFold是否會簡化開發(fā)安全藥物這一昂貴且步驟繁多的過程。正在新疫苗開發(fā)階段的科學(xué)家們發(fā)現(xiàn)AlphaFold極為有用,有時候甚至是顛覆性的。然而對于疫苗領(lǐng)域來說,AlphaFold還只是補充了實驗研究結(jié)果和其他映射和調(diào)整病毒蛋白結(jié)構(gòu)的方法。
德國的歐洲分子生物學(xué)實驗室(EMBL)結(jié)構(gòu)模型專家Jan Kosinski認(rèn)為,預(yù)測的結(jié)構(gòu)對于大多數(shù)研究人員來說只是研究的起點,而非終點。他補充道:“起初,人們擔(dān)心它會取代結(jié)構(gòu)生物學(xué),人們會失業(yè)什么的。實際上結(jié)果恰恰相反。”
自2016年起與DeepMind合作開發(fā)AlphaFold初代的倫敦大學(xué)學(xué)院生物信息學(xué)家David Jones表示,這一工具的最大影響之一是改變了生物學(xué)家的思維方式:“計算機能夠生成有用假設(shè),這些假設(shè)能在實驗室中測試。”
創(chuàng)造新蛋白質(zhì)
在DeepMind開始致力于研究AlphaFold的二十多年前,計算生物物理學(xué)家David Baker和他的同事們開發(fā)了一個名為Rosetta的軟件工具,它可以利用物理原理來模擬蛋白質(zhì)結(jié)構(gòu)。該工具通過比較多個現(xiàn)有蛋白質(zhì)結(jié)構(gòu)和序列的小片段,識別出能折疊成特定形狀的蛋白質(zhì)序列。
最初,Rosetta被用于預(yù)測蛋白質(zhì)結(jié)構(gòu),并于AlphaFold崛起之前在許多CASP競賽中名列前茅。但Baker很快意識到這一模型也可以反過來用,設(shè)計出全新的蛋白質(zhì)。
這一工具早期在設(shè)計新型蛋白質(zhì)方面取得了成功,包括設(shè)計出新型酶,能夠與其他分子緊密結(jié)合的蛋白質(zhì),以及類似病毒的自組裝蛋白納米顆粒(其中一種成為了一例已獲批準(zhǔn)的COVID-19疫苗的基礎(chǔ))。
在AlphaFold2宣布(但尚未發(fā)布)的時候,Baker及其團(tuán)隊(包括現(xiàn)就職于韓國首爾大學(xué)的計算化學(xué)家Minkyung Baek)開始研究該軟件,將其中一些技術(shù)應(yīng)用于過去AI驅(qū)動版本的Rosetta。由此產(chǎn)生的第一個RoseTTAFold網(wǎng)絡(luò)表現(xiàn)幾乎能與AlphaFold2相媲美。自2021年以來,這兩個網(wǎng)絡(luò)不斷被其開發(fā)者和其他科學(xué)家改進(jìn)以應(yīng)對新的挑戰(zhàn),例如預(yù)測多種不同相互作用蛋白質(zhì)復(fù)合體的結(jié)構(gòu)。
近年來,Baker的團(tuán)隊特別專注于將機器學(xué)習(xí)應(yīng)用于實驗室的核心使命:創(chuàng)造自然界中從未見過的新型蛋白質(zhì)。Baker團(tuán)隊最近開發(fā)的一種工具結(jié)合了RoseTTAFold與圖像生成擴(kuò)散神經(jīng)網(wǎng)絡(luò),將研究人員設(shè)計蛋白質(zhì)的能力提升了一大步。
進(jìn)展迅速
在Baker的實驗室完成博士學(xué)位的麻省理工學(xué)院(MIT)進(jìn)化生物學(xué)家Sergey Ovchinnikov說,這些工具極大地加速了蛋白質(zhì)設(shè)計的發(fā)展,并使其更具普及性。過去,Rosetta需要在數(shù)百個處理器上運行數(shù)周才能設(shè)計出一種蛋白質(zhì),而現(xiàn)在的新型AI工具僅需幾秒即可完成這一任務(wù)。Ovchinnikov 說:“現(xiàn)在世界上的每個人都可以進(jìn)行蛋白質(zhì)設(shè)計了。”
“我深受該領(lǐng)域其他研究者及合作者的啟發(fā)。”Baker在諾貝爾獎頒獎發(fā)布會上通過電話說道:“我站在巨人的肩膀上。”
韓國首爾國立大學(xué)的計算生物學(xué)家Martin Steinegger將AlphaFold、RoseTTAFold以及其他生物AI工具的影響比作阿波羅登月計劃,認(rèn)為它們展示了工程可以實現(xiàn)的成就。他說:“這對結(jié)構(gòu)預(yù)測和結(jié)構(gòu)生物學(xué)領(lǐng)域來說是一個類似的時刻,讓我們看到了究竟什么是可能的。”
對于諾貝爾委員會的決定,幾乎沒有人感到意外。Jones表示對于Baker來說:“鑒于他在這個領(lǐng)域完成的大量工作,大多數(shù)人認(rèn)為這是遲早的事情。”Jumper在新聞發(fā)布會上表示,他知道自己和Hassabis在許多人的候選名單上,因此宣布結(jié)果的前一晚難以入睡。
對于Jumper來說,AlphaFold提供的預(yù)測結(jié)構(gòu)為科學(xué)發(fā)現(xiàn)創(chuàng)造了新的機遇。數(shù)百萬科學(xué)家已經(jīng)使用了這些工具,他希望其中哪位不久后也會接到從瑞典打來的電話。他說:“要是諾貝爾獎涉及了用AlphaFold做的工作,那會是讓我?guī)缀跬瑯蛹拥臅r刻。”
原文以Chemistry Nobel goes to developers of AlphaFold AI that predicts protein structures標(biāo)題發(fā)表在2024年10月9日《自然》的新聞版塊上
nature
Doi:10.1038/d41586-024-03214-7