11月1日,2024四川網信“數智領航”第十四期川網聯(lián)“走進新質生產力前沿”系列活動暨第十屆生物醫(yī)學大數據智能技術會議在成都舉行。會上,中國科學院院士、中國科學院生物物理研究所研究員陳潤生接受了封面新聞記者的專訪。
中國科學院院士、中國科學院生物物理研究所研究員陳潤生
陳潤生是我國最早從事理論生物學和生物信息學研究的科研人員之一,是以基因組為研究對象進行生物信息學研究的先行者。此次采訪中,他闡述了自己對人工智能與生物信息的深度思考與見解。
AI在生物醫(yī)藥的應用還在早期階段
人工智能大模型和生物醫(yī)學大數據之間的淵源已久。陳潤生提到,人工智能最早應用在醫(yī)療領域的是病案管理,基本信息的記錄包括電子病歷的管理,這些流程都實現了自動化!叭斯ぶ悄懿粌H僅是讓醫(yī)療管理更方便,實際上整個過程中也在積累多層次大數據,這些內容可以分析出一些規(guī)律。比如過去一個新藥的發(fā)現,往往要篩選上萬個點,用十年時間投資10億美金,現在用了大模型可以大大縮減流程!
陳潤生看到,特別是今年很多獎項,包括諾貝爾物理學獎、化學獎,都授予了人工智能大模型領域,他認為這是極端少見的,所以可以充分體會到大模型的震撼和深遠的社會影響。
那么大模型到底對社會帶來了哪些變革?陳潤生認為最典型的兩點是解決了自然語言的處理和實現了多模態(tài)的融合。“比如我們生物醫(yī)學用的組學大數據,包括基因組、轉錄組、蛋白組、代謝組、表觀組,再加上醫(yī)學當中各種各樣的生理生化指標,包括心電、腦電和影像學資料,每一個的基本標準都不一樣,怎么融合?從現在看來建模是不現實的,大模型給我們提出了一個非常好的場所!
但總的來說,陳潤生認為大模型在各個行業(yè)的應用還需要一個漫長的路程,目前AI在生物醫(yī)藥的應用還處在早期階段。
構造專業(yè)大模型是一條更敏捷的路
當下,大模型成為兵家必爭之地。但是大模型怎么構造?陳潤生指出了一條“更敏捷的路”。
他提到,因普適大模型建造成本非常高,所以更好的辦法是建造一個行業(yè)大模型。“選擇一個在國際上公開發(fā)表的并合適的足夠前沿的大模型,把它拷貝過來作為大模型的基底,保證你的大模型具有國際水平。然后把你自己收集的數據,建立的技術方法,加載到這個基底上,就建成了具有國際水平又有自身特色的行業(yè)大模型,實際行業(yè)大模型還可以分層再細化。”
那么在行業(yè)大模型的發(fā)展中還有哪些問題急需解決?陳潤生告訴記者,一個是數據的標準化,另一個是數據的整合。他指出,行業(yè)內的很多數據標準化不同,此外很多數據不透明,數據整合是應用者的訴求也是管理部門需要協(xié)調的。實際上,依靠醫(yī)學數據,能夠讓大模型發(fā)揮更好的作用。
“面向未來的發(fā)展中,大模型并不僅僅是提供了一個輔助工具,更重要的是大模型出現了所謂的涌現、頓悟和幻覺。”陳潤生表示,當大模型系統(tǒng)達到一定程度之后,它會產生新的智能,人工智能能否超過人類智能?這又成為一個深刻的科學問題。
封面新聞記者 朱珠