劃重點(diǎn)
012024年諾貝爾化學(xué)獎授予大衛(wèi)貝克(David Baker)、德米斯哈薩比斯(Demis Hassabis)和約翰M詹珀(John M. Jumper),分別表彰他們在計算蛋白質(zhì)設(shè)計方面的貢獻(xiàn)和蛋白質(zhì)結(jié)構(gòu)預(yù)測方面的成就。
02戴米斯哈薩比斯和約翰詹珀共同創(chuàng)立了DeepMind,后者開發(fā)了AlphaFold,成功預(yù)測了幾乎所有已知蛋白質(zhì)的結(jié)構(gòu)。
03大衛(wèi)貝克發(fā)明了從頭設(shè)計自然界從未出現(xiàn)的新型蛋白的技術(shù),獲得了2020年科學(xué)突破獎生命科學(xué)獎。
04除此之外,AlphaFold 3在藥物設(shè)計方面具有巨大潛力,可以預(yù)測藥物中常用的分子,為制藥行業(yè)帶來AI革命。
以上內(nèi)容由騰訊混元大模型生成,僅供參考
10.9
知識分子
The Intellectual
導(dǎo) 讀
剛剛,2024年諾貝爾化學(xué)獎公布,一半授予大衛(wèi)貝克(David Baker),“以表彰在計算蛋白質(zhì)設(shè)計方面的貢獻(xiàn)”;另一半則共同授予德米斯哈薩比斯(Demis Hassabis)和約翰M詹珀(John M. Jumper),“以表彰他們在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面的成就”。
德米斯哈薩比斯和約翰詹珀成功地利用人工智能技術(shù)預(yù)測了幾乎所有已知蛋白質(zhì)的結(jié)構(gòu)。而大衛(wèi)貝克掌握了生命的構(gòu)建模塊,并創(chuàng)造了全新的蛋白質(zhì)。
撰文 | 秦朗
● ● ●
2024年諾貝爾化學(xué)獎獲得者:戴密斯哈薩比斯(Demis Hassabis)、約翰喬普(Jonh Jumper)、大衛(wèi)貝克(David Baker)
戴密斯哈薩比斯 (Demis Hassabis)
哈薩比斯早就享譽(yù)國際科技圈。出生于1976年,在倫敦長大,母親是新加坡華人。4歲開始下國際象棋,有“國際象棋神童”的美譽(yù),8歲自學(xué)編程,13歲時達(dá)到了大師標(biāo)準(zhǔn)。本科以計算機(jī)科學(xué)雙一的成績畢業(yè)于劍橋大學(xué),后來在倫敦大學(xué)學(xué)院完成了認(rèn)知神經(jīng)科學(xué)博士學(xué)位,又在MIT和哈佛攻讀博士后。
2010年,他與在倫敦大學(xué)學(xué)院讀博士遇到的施恩萊格(Shane Legg)共同創(chuàng)辦了DeepMind并擔(dān)任CEO。2014年,DeepMind被Google收購,在Alphabet旗下獨(dú)立運(yùn)營。2023年,DeepMind與“谷歌大腦”合并,Hassabis升任合并后的Google DeepMind團(tuán)隊CEO。
約翰喬普(John Jumper)
DeepMind Technologies高級研究科學(xué)家,AlphaFold的第一作者。他在芝加哥大學(xué)獲得博士學(xué)位,主要研究方向是使用ML來模擬蛋白質(zhì)折疊和動力學(xué)。2021年,他被Nature列為年度榜單中的十大“重要人物”之一。
戴維貝克(David Baker)
1962年出生于美國華盛頓州西雅圖,現(xiàn)為華盛頓大學(xué)蛋白質(zhì)設(shè)計研究所所長。他因開發(fā)從頭設(shè)計自然界從未出現(xiàn)的新型蛋白的技術(shù),獲得2020年科學(xué)突破獎生命科學(xué)獎,并首次使用生成式人工智能從頭設(shè)計出了全新的抗體,有望讓AI從頭設(shè)計蛋白進(jìn)入抗體藥物市常
他還堪稱蛋白質(zhì)設(shè)計領(lǐng)域“鼻祖級”人物,比DeepMind更早提出了預(yù)測和設(shè)計蛋白質(zhì)三維結(jié)構(gòu)的方法,甚至設(shè)計出了一款比AlphaFold更早的蛋白結(jié)構(gòu)設(shè)計算法RoseTTAFold。
為什么是蛋白折疊?
作為支撐人體基本生命活動的物質(zhì),蛋白質(zhì)由20種氨基酸呈念珠狀連接形成三維形狀,而形狀本身決定了蛋白質(zhì)的功能,所以研究蛋白質(zhì)形狀一直是醫(yī)學(xué)領(lǐng)域的熱門方向。
在 AlphaFold 出現(xiàn)之前,這都需要通過實驗來完成的。讓蛋白質(zhì)結(jié)晶是件非常困難的事情,有些蛋白質(zhì)不能像膜蛋白那樣結(jié)晶,必須使用昂貴的電子顯微鏡或X射線晶體分析儀,耗費(fèi)數(shù)月、甚至幾年,才能得到三維結(jié)構(gòu)并將其結(jié)構(gòu)可視化。無數(shù)博士都在研究單一蛋白質(zhì)的折疊。
而AlphaFold2 能夠直接從蛋白質(zhì)的氨基酸序列中預(yù)測蛋白質(zhì)的3D結(jié)構(gòu),并且達(dá)到原子級精度,被認(rèn)為解決了困擾人類50年歷史的蛋白質(zhì)折疊挑戰(zhàn),迅速推進(jìn)了人類對基本生物過程的理解,并促進(jìn)藥物設(shè)計。
2018年,DeepMind官宣了旗下AlphaFold。初亮相時,它在第13屆“蛋白質(zhì)結(jié)構(gòu)預(yù)測奧運(yùn)會”CASP比賽中,成功預(yù)測了43種蛋白質(zhì)中25種蛋白質(zhì)的最準(zhǔn)確結(jié)構(gòu),力壓其他97個參賽者。
DeepMind發(fā)布的一個蛋白質(zhì)3D數(shù)字演示圖
A DeepMind model of a protein from the Legionnaire's disease bacteria (Casp-14)(軍團(tuán)病細(xì)菌(Casp-14)蛋白質(zhì)的DeepMind模型)
基于初代版本,2020年,DeepMind又祭出了AlphaFold2。它能夠在廣泛領(lǐng)域進(jìn)行蛋白質(zhì)結(jié)構(gòu)的預(yù)測,已經(jīng)將兩億多蛋白的三維結(jié)構(gòu)全部都預(yù)測出來,在結(jié)構(gòu)生物學(xué)中是最重要的里程碑的貢獻(xiàn),對后續(xù)蛋白質(zhì)結(jié)構(gòu)及功能研究具有開創(chuàng)性意義。
該系統(tǒng)還在應(yīng)用層面,特別是對生物制藥的促進(jìn)作用巨大。了解蛋白質(zhì)的三維結(jié)構(gòu),對于設(shè)計針對性的藥物分子也大有幫助。如今全球已有數(shù)百萬研究人員將 AlphaFold 2 應(yīng)用在瘧疾疫苗、癌癥治療和酶設(shè)計等領(lǐng)域,有了不少新的發(fā)現(xiàn)。之后的 AlphaFold-Multimer 則推動了對蛋白質(zhì)-蛋白質(zhì)復(fù)合物的預(yù)測。
今年5月,由 Google DeepMind 和 Isomorphic Labs 研究團(tuán)隊推出的新一代 AlphaFold AlphaFold 3登上了 Nature。
據(jù)介紹,AlphaFold 3 以前所未有的精確度成功預(yù)測了所有生命分子(蛋白質(zhì)、DNA、RNA、配體等)的結(jié)構(gòu)和相互作用。與現(xiàn)有的預(yù)測方法相比,AlphaFold 3 發(fā)現(xiàn)蛋白質(zhì)與其他分子類型的相互作用至少提高了 50%,對于一些重要的相互作用類別,預(yù)測準(zhǔn)確率甚至提高了一倍。
研究團(tuán)隊認(rèn)為,AlphaFold 3 可以將我們從蛋白質(zhì)帶入廣泛的生物分子領(lǐng)域,這一飛躍有望開啟更具變革性的科學(xué)從開發(fā)生物可再生材料和更具抗逆性的作物,到加速藥物設(shè)計和基因組學(xué)研究,進(jìn)而開啟人工智能細(xì)胞生物學(xué)的新時代。
從圍棋到蛋白質(zhì)結(jié)構(gòu)預(yù)測
2016年,一場“對決”吸引了全世界的目光。韓國圍棋選手李世石與AlphaGo,進(jìn)行了一場 “世紀(jì)人機(jī)大戰(zhàn)”。最終,AlphaGo以 3:00 的戰(zhàn)績獲得勝利。
作為AlphaGo背后的英雄,Google旗下人工智能企業(yè)DeepMind的創(chuàng)始人Demis Hassabis,也獲得了全球的關(guān)注。
許多人認(rèn)為圍棋是世界上最復(fù)雜的棋盤游戲。當(dāng) DeepMind 團(tuán)隊在慶祝獲勝時, Hassabis已經(jīng)在考慮一個更大的挑戰(zhàn)。他意識到該公司的技術(shù)已經(jīng)準(zhǔn)備好應(yīng)對生物學(xué)中最重要和最復(fù)雜的難題之一:預(yù)測蛋白質(zhì)的結(jié)構(gòu),這個 50 年來科研人員一直試圖解決的難題。
在 Hassabis的心中,構(gòu)建的 AlphaGo雖然與游戲相關(guān),但最終目標(biāo)不僅僅是破解游戲,而是使用它來引導(dǎo)通用學(xué)習(xí)系統(tǒng),并應(yīng)對現(xiàn)實世界的挑戰(zhàn),致力于像蛋白質(zhì)折疊這樣的科學(xué)挑戰(zhàn)。
2016 年,AlphaGo 獲得成功后的幾個月內(nèi),DeepMind 雇傭了一些生物學(xué)家,并成立了一個小型跨學(xué)科團(tuán)隊來解決蛋白質(zhì)折疊問題。
2018年,DeepMind官宣了旗下AlphaFold。初亮相時,它在第13屆“蛋白質(zhì)結(jié)構(gòu)預(yù)測奧運(yùn)會”CASP比賽中,成功預(yù)測了43種蛋白質(zhì)中25種蛋白質(zhì)的最準(zhǔn)確結(jié)構(gòu),力壓其他97個參賽者。
CASP競賽成立于 1994 年,其旨在通過每兩年讓計算機(jī)化預(yù)測方法相互競爭來加快研究速度。然而,沒有任何一種技術(shù)能達(dá)到實驗室工作的準(zhǔn)確性。到 2016 年,相關(guān)工作進(jìn)展已經(jīng)停滯了十年。
基于初代版本,2020年,DeepMind又開發(fā)了AlphaFold2。它已經(jīng)能成功解決蛋白質(zhì)折疊問題,在預(yù)測蛋白質(zhì)結(jié)構(gòu)上,和實驗室生產(chǎn)模型的精度誤差范圍,首次縮小到只有一個原子的寬度。生物學(xué)家對它的出色表現(xiàn)感到震驚。AlphaFold 使用了蛋白質(zhì)數(shù)據(jù)庫中現(xiàn)有的蛋白質(zhì)結(jié)構(gòu)作為大數(shù)據(jù)基矗這是一個國際數(shù)據(jù)庫,包含了生物學(xué)家?guī)资陙聿粩嘣黾拥囊呀鉀Q的結(jié)構(gòu)。
2021年7月,AlphaFold成功預(yù)測了近98.5%的人類蛋白質(zhì)結(jié)構(gòu)。而到了2022年7月AlphaFold預(yù)測了幾乎“整個蛋白質(zhì)宇宙”。
按照哈薩比斯接受媒體采訪時的說法,多年來,他一直在斷斷續(xù)續(xù)地思考蛋白質(zhì)問題。20 世紀(jì) 90 年代,當(dāng)他還是劍橋大學(xué)的一名本科生時,他就接觸到了這個問題。他表示:“我的一個朋友對這個問題很著迷,他會抓住任何機(jī)會(在酒吧里或者打臺球的時候)跟我說,如果我們能破解蛋白質(zhì)折疊,這將是生物學(xué)的變革。他的激情始終讓我不能釋懷。”
AlphaFold 的成功標(biāo)志著 DeepMind 的發(fā)展方向已然發(fā)生改變,工作重點(diǎn)從游戲轉(zhuǎn)向科學(xué),以期對現(xiàn)實世界產(chǎn)生更大影響。
2021年7月,DeepMind 首次通過與歐洲分子生物學(xué)實驗室(EMBL)合作建立的數(shù)據(jù)庫公開發(fā)布 AlphaFold 預(yù)測結(jié)果,初始數(shù)據(jù)庫包含了所有人類蛋白質(zhì)的98%
人工智能掀起生物醫(yī)學(xué)革命
AlphaFold 3 具備了藥物設(shè)計的能力,可以預(yù)測藥物中常用的分子(如配體和抗體),這些分子可與蛋白質(zhì)結(jié)合,改變蛋白質(zhì)在人類健康和疾病中的相互作用方式。 在預(yù)測類似藥物相互作用(包括蛋白質(zhì)與配體的結(jié)合以及抗體與靶蛋白的結(jié)合)方面,AlphaFold 3 達(dá)到了前所未有的準(zhǔn)確性。
為了利用 AlphaFold 3 在藥物設(shè)計方面的潛力,Isomorphic Labs 已經(jīng)與制藥公司合作,將其應(yīng)用于現(xiàn)實世界的挑戰(zhàn),并最終為一些對人類造成最具破壞性影響的疾病開發(fā)出新的療法。
據(jù)了解,Isomorphic Labs 將 AlphaFold 3 與一套補(bǔ)充的內(nèi)部人工智能模型結(jié)合,正在為內(nèi)部項目以及制藥合作伙伴進(jìn)行藥物設(shè)計。
值得關(guān)注的是,Demis Hassabis 同時領(lǐng)導(dǎo)著生物技術(shù)初創(chuàng)公司Isomorphic Labs。它成立于 2021 年,同樣由Google的母公司 Alphabet 投資,旨在將 DeepMind 在生物學(xué)方面的人工智能研究進(jìn)一步帶入制藥行業(yè),希望在藥物發(fā)現(xiàn)領(lǐng)域帶來一場 AI 革命,使用人工智能來加速藥物發(fā)現(xiàn),并最終找到治療人類一些最具破壞性的疾病的方法。
很長一段時間以來,Demis Hassabis 一直在想,一旦人工智能足夠復(fù)雜、足夠強(qiáng)大,他最先想做的,是幫助治療疾病和理解生物學(xué)。
從人工智能優(yōu)先的角度進(jìn)行藥物發(fā)現(xiàn),在計算機(jī)中完成大部分研究,并將實驗室留給驗證,是其中一個重要內(nèi)容。
與分子發(fā)生反應(yīng),搭建通路,最終形成一個虛擬細(xì)胞,是他的一個夢想。這樣,就可以在虛擬細(xì)胞上進(jìn)行大量實驗,最后階段再進(jìn)入實驗室來驗證。就發(fā)現(xiàn)新藥而言,目前從確定目標(biāo)到擁有一個候選藥物大約需要10年時間,如果能在虛擬細(xì)胞中完成大部分工作,或許可以將時間縮短一個數(shù)量級。
DeepMind正與更多實驗室合作,通過構(gòu)建虛擬細(xì)胞進(jìn)行大量實驗,以大大縮短醫(yī)學(xué)及藥物方面的研究時間。
DeepMind 已經(jīng)發(fā)布了該系統(tǒng)的詳細(xì)工作原理,并發(fā)布了源代碼。AlphaFold 開源之后,影響力逐漸擴(kuò)大。在該公司還與歐洲生物信息學(xué)研究所(European Bioinformatics Institute)建立了一個公共數(shù)據(jù)庫,該數(shù)據(jù)庫正在填充 AI 預(yù)測的新的蛋白質(zhì)結(jié)構(gòu),條目幾乎是科學(xué)已知的所有蛋白質(zhì)。
Google DeepMind 也基于AlphaFold 3 推出了免費(fèi)平臺AlphaFold Server,供全世界的科學(xué)家利用它進(jìn)行非商業(yè)性研究,預(yù)測蛋白質(zhì)如何與細(xì)胞中的其他分子相互作用。
只需點(diǎn)擊幾下,生物學(xué)家就可以利用 AlphaFold 3 為由蛋白質(zhì)、DNA、RNA 以及選擇的配體、離子和化學(xué)修飾組成的結(jié)構(gòu)進(jìn)行建模。
對此,F(xiàn)rancis Crick 研究所 Uhlmann 實驗室的研究科學(xué)家 Céline Bouchoux 評價道:
“AlphaFold 3 一經(jīng)發(fā)布,有可能像 AlphaFold 一樣具有開創(chuàng)性。有了 AlphaFold Server,其不再僅僅是預(yù)測結(jié)構(gòu),而是慷慨地提供訪問權(quán)限:允許研究人員提出大膽的問題,并加速發(fā)現(xiàn)。”
這兩年,AlphaFold成為了生物醫(yī)藥界的新貴,甚至獲得了不少生物醫(yī)藥相關(guān)的科學(xué)大獎。世界各地的一些團(tuán)隊已經(jīng)開始在抗生素耐藥性、癌癥和新冠病毒等研究中使用 AlphaFold。
另一個重大進(jìn)展是,今年3月18日,David Baker在預(yù)印本BioRxiv上發(fā)文,首次使用生成式人工智能從頭設(shè)計出了全新的抗體,這一重要發(fā)現(xiàn)未來有望讓AI從頭設(shè)計蛋白進(jìn)入抗體藥物市常
鮮為人知的是,AlphaFold一直存在諸多競爭者,其中最為知名的莫過于華盛頓大學(xué)的David Baker團(tuán)隊。
Baker是預(yù)測和設(shè)計蛋白質(zhì)三維結(jié)構(gòu)方法的開創(chuàng)者,早在1998年由他主導(dǎo)設(shè)計的蛋白結(jié)構(gòu)設(shè)計算法Rosetta就有了最初版本,遠(yuǎn)遠(yuǎn)早于AlphaFold。而這兩年,Baker更是致力于超越AlphaFold,為此,Baker團(tuán)隊曾在Science雜志上連發(fā)3篇論文,介紹新算法ProteinMPNN。他認(rèn)為,ProteinMPNN之于蛋白質(zhì)設(shè)計,就像AlphaFold之于蛋白質(zhì)結(jié)構(gòu)預(yù)測一樣。
“AI for Science”:AlphaFold可能是AI變革科學(xué)發(fā)現(xiàn)的開始
雖然通常被當(dāng)作游戲和圍棋界的明星事物想起,談及2010 年創(chuàng)辦DeepMind時,Hassabis認(rèn)為其只有一個目標(biāo)創(chuàng)造解決世界上一切問題的通用人工智能(AGI),并將之形容為“21 世紀(jì)的阿波羅登月計劃”。
在讀博士期間,他夢想有一天創(chuàng)造出“人工智能科學(xué)家”,也就是說,創(chuàng)造一個比人類科學(xué)家還要聰明的“機(jī)器人科學(xué)家”。十多年來,DeepMind一直是推進(jìn)人工智能技術(shù)前沿發(fā)展的先鋒,通常是使用游戲作為開發(fā)通用目的學(xué)習(xí)系統(tǒng)的試驗常
Hassabis的想法是,通過AI,將科學(xué)加速到極致,并且認(rèn)為自己已經(jīng)發(fā)現(xiàn)了一種“讓科學(xué)研究更有效率”的方法。在他眼中,人工智能系統(tǒng)正變得足夠強(qiáng)大,可以應(yīng)用于許多現(xiàn)實世界的問題,包括科學(xué)發(fā)現(xiàn)本身。他認(rèn)為,有一天,人工智能系統(tǒng)可能會解決像廣義相對論這樣的問題。
“癌癥、氣候變遷、能源、基因組學(xué)、宏觀經(jīng)濟(jì)學(xué)、金融系統(tǒng)、物理學(xué)等,太多我們想掌握的系統(tǒng)知識正變得極其復(fù)雜,如此巨大的信息量讓最聰明的人窮其一生也無法完全掌握。如何才能從如此龐大的數(shù)據(jù)量中篩選出正確的見解呢?”他認(rèn)為,未來超級智能機(jī)器將與人類專家合作解決一切問題,一種通用人工智能可以自動將非結(jié)構(gòu)化信息轉(zhuǎn)換為可使用知識,這是一種針對任何問題的元解決方法(meta-solution)。
雖然他的夢想聽起來還有點(diǎn)遙遠(yuǎn),在現(xiàn)實中,借助 AlphaFold,DeepMind 開啟了新篇章。公司正投資一個名為“AI for Science”的團(tuán)隊,它已經(jīng)發(fā)表了一系列出版物,涉及從天氣預(yù)報到數(shù)學(xué)、量子化學(xué)和核聚變等領(lǐng)域。它們都沒有 AlphaFold 的影響力,但雄心顯而易見。
事實上,從根本上加快科學(xué)研究的步伐,尤其對醫(yī)學(xué)、氣候科學(xué)和綠色技術(shù)等領(lǐng)域的幫助,并非Hassabis或者DeepMind單個的夢想。
當(dāng)前,在各個領(lǐng)域,應(yīng)用人工智能方法分析數(shù)據(jù)、構(gòu)建復(fù)雜生物現(xiàn)象的強(qiáng)大預(yù)測模型和生成模型,已然成為強(qiáng)大的科技創(chuàng)新潮流。例如,用AI識別新的抗生素、揭示希格斯玻色子,建模和分析星系形成,篩選粒子對撞機(jī)或機(jī)器人望遠(yuǎn)鏡產(chǎn)生的大量數(shù)據(jù)、尋找其中的規(guī)律,識別具有電池或太陽能電池所需特性的材料,等等。
AI變革科學(xué)發(fā)現(xiàn)的歷程,可能真的剛剛開始。
參考文獻(xiàn):(上下滑動可瀏覽)
1.Alphahold official website:https://www.deepmind.com/research/highlighted-research/alphafold
2.2021 BREAKTHROUGH OF THE YEAR:https://www.science.org/content/article/breakthrough-2021
3.How Google Plans to Solve Artificial Intelligence:https://www.technologyreview.com/2016/03/31/161234/how-google-plans-to-solve-artificial-intelligence/
4.One of biology's biggest mysteries 'largely solved' by AI:https://www.bbc.com/news/science-environment-55133972
5.How artificial intelligence can revolutionise science:
https://www.economist.com/leaders/2023/09/14/how-artificial-intelligence-can-revolutionise-science
6.The superhero of artificial intelligence: can this genius keep it in check?
https://www.theguardian.com/technology/2016/feb/16/demis-hassabis-artificial-intelligence-deepmind-alphago
7.拉斯克獎揭曉!專家詳解:https://baijiahao.baidu.com/sid=1777762137149969481&wfr=spider&for=pc
8. Accurate structure prediction of biomolecular interactions with AlphaFold 3https://www.nature.com/articles/s41586-024-07487-w
9. 首次用生成式AI設(shè)計抗體,蛋白質(zhì)設(shè)計領(lǐng)域“鼻祖”David Baker的最新研究
https://mp.weixin.qq.com/s/DMRGSUjeHuPnKtzOBJfm2Q