(農(nóng)健使用AI工具生成/圖)
醫(yī)療模擬經(jīng)營(yíng)游戲《雙點(diǎn)醫(yī)院》(Two Point Hospital)可能成為現(xiàn)實(shí)嗎?動(dòng)動(dòng)手指就能造一個(gè)格子間,就診的患者得了什么病醫(yī)生一目了然:情緒崩潰者被送進(jìn)“笑療室”,“光頭癥”者進(jìn)入脫光診所……里面怪異的機(jī)器自己就能治愈患者。
盡管這是天方夜譚,但AI醫(yī)生給AI患者看病,已成為現(xiàn)實(shí)。就在2024年11月,在一家涵蓋發(fā)病、問(wèn)診、檢查、治療等內(nèi)容的閉環(huán)虛擬醫(yī)院中,來(lái)自21個(gè)科室的42位AI醫(yī)生在開(kāi)始內(nèi)測(cè)“坐診”。該系統(tǒng)為清華大學(xué)智能產(chǎn)業(yè)研究院研發(fā)的Agent Hospital(下稱“清華AI醫(yī)院”)。
除了看病,這家醫(yī)院更主要的目的,是打造出更強(qiáng)的醫(yī)生智能體和更逼真的患者智能體。該研究共同通訊作者、清華大學(xué)智能產(chǎn)業(yè)研究院助理研究員馬為之告訴南方周末記者,醫(yī)生與患者在虛擬環(huán)境交流中,AI患者給AI醫(yī)生反饋,AI醫(yī)生從中學(xué)習(xí),彼此訓(xùn)練。打造出的高水平AI醫(yī)生,可以輔助人類醫(yī)生,成為一個(gè)AI助手或分身。
AI已經(jīng)走入越來(lái)越多醫(yī)院。入院導(dǎo)診、醫(yī)生開(kāi)病歷、拍超聲和CT、做手術(shù)等環(huán)節(jié),AI均開(kāi)始介入。2024年11月,國(guó)家衛(wèi)生健康委等部門(mén)發(fā)布的《衛(wèi)生健康行業(yè)人工智能應(yīng)用場(chǎng)景參考指引》中共提到了84個(gè)場(chǎng)景,涵蓋醫(yī)療服務(wù)、產(chǎn)業(yè)發(fā)展和教學(xué)科研多個(gè)方面。12月,上海等地也發(fā)布發(fā)展醫(yī)學(xué)人工智能方案。
只不過(guò),AI更像是沉默的后臺(tái)員工不會(huì)因?yàn)楹瓤Х榷诱`病歷分析,也不會(huì)對(duì)病人的焦慮和痛苦投以同情的眼神。
“醫(yī)生一半的精力能被釋放出來(lái)”
身體不舒服,掛什么科?怎么掛第二天的號(hào)?到醫(yī)院了,科室在幾層?如何支付?這些問(wèn)題“安診兒”會(huì)立刻給出答案。
“安診兒”是浙江省衛(wèi)生健康委發(fā)布的數(shù)字健康人,2023年底上線,現(xiàn)已迭代為2.0版本。“用AI不僅能提高醫(yī)療健康服務(wù)的交互性,還能把線上線下的服務(wù)進(jìn)行串聯(lián),整個(gè)就醫(yī)流程比傳統(tǒng)流程平均節(jié)省20分鐘左右。”浙江省衛(wèi)生健康信息中心副主任郭一說(shuō)。
郭一介紹,為了保證“安診兒”回答的準(zhǔn)確性,采用嚴(yán)肅醫(yī)療健康數(shù)據(jù)喂養(yǎng),不用不明來(lái)源的醫(yī)學(xué)知識(shí),同時(shí)也會(huì)標(biāo)注回答僅供參考,具體以醫(yī)生建議為準(zhǔn)。除此之外,應(yīng)用場(chǎng)景經(jīng)過(guò)嚴(yán)格評(píng)估,如智能導(dǎo)診分診、健康咨詢、健康知識(shí)宣教等場(chǎng)景,居民需求大且應(yīng)用風(fēng)險(xiǎn)低。
“安診兒”在落地醫(yī)院還注入了特色數(shù)據(jù)。比如,浙江省人民醫(yī)院就在此基礎(chǔ)上做了定制版,覆蓋門(mén)診五十多個(gè)場(chǎng)景。該院門(mén)診部主任袁方發(fā)現(xiàn),使用一年來(lái),通過(guò)“安診兒”預(yù)約掛號(hào)的患者占比從5%上升到25%,院內(nèi)問(wèn)詢數(shù)量減少了很多。
當(dāng)患者踏入科室的那刻起,AI已開(kāi)始承擔(dān)起預(yù)問(wèn)診職能。在微醫(yī)上海人工智能醫(yī)院,患者講述的病情通過(guò)HIS(醫(yī)院信息系統(tǒng))傳到醫(yī)生手上,AI對(duì)患者病情分級(jí),提供用藥指引,整個(gè)過(guò)程離不開(kāi)醫(yī)生。在浙江省人民醫(yī)院,醫(yī)生寫(xiě)病歷可在語(yǔ)音輸入基礎(chǔ)上,通過(guò)AI提示關(guān)鍵詞和疾病要點(diǎn)對(duì)病歷內(nèi)容進(jìn)行補(bǔ)充。據(jù)悉,這項(xiàng)技術(shù)在住院病歷書(shū)寫(xiě)中已經(jīng)大規(guī)模推開(kāi),部分門(mén)診科室的病歷書(shū)寫(xiě)也已投入試用。
對(duì)醫(yī)院而言,病歷質(zhì)量關(guān)乎醫(yī)療安全、績(jī)效考核等多方面,已有不少醫(yī)院使用AI進(jìn)行病歷內(nèi)涵質(zhì)控,避免病歷中出現(xiàn)男性做了婦科手術(shù)、左肺病變做了右肺切除這種低級(jí)錯(cuò)誤!凹偈刮臅(shū)工作大模型都能解決,至少醫(yī)生一半的工作精力是能夠被釋放出來(lái)的!北本┐髮W(xué)人民醫(yī)院胸外科副主任醫(yī)師陳修遠(yuǎn)說(shuō)。
回答患者詢問(wèn)中,AI也有一些問(wèn)題,陳修遠(yuǎn)就發(fā)現(xiàn),ChatGPT等大模型似乎更多“順著提問(wèn)者作答”。美國(guó)斯坦福大學(xué)在2023年發(fā)布的一項(xiàng)研究指出,為了提高用戶體驗(yàn)和參與度,對(duì)話系統(tǒng)往往被設(shè)計(jì)成傾向于提供建設(shè)性和支持性的回應(yīng)。包括OpenAI的研究也指出,過(guò)度順從可能導(dǎo)致模型在面對(duì)不當(dāng)請(qǐng)求時(shí)缺乏足夠的判斷力。
在特定任務(wù)上“幾乎可以達(dá)到最頂尖醫(yī)生的水平”
聽(tīng)完患者病情描述,醫(yī)生開(kāi)出檢查單,下一步患者前往檢查室做檢查。
X光、磁共振(MRI)、超聲……患者在儀器上,什么都不用做,檢查就已完成,雖然看不到,其實(shí)AI一樣參與其中。深圳大學(xué)醫(yī)學(xué)部生物醫(yī)學(xué)工程學(xué)院副院長(zhǎng)倪東介紹,磁共振因?yàn)椴杉盘?hào)密集,成像時(shí)間長(zhǎng),利用AI介入成像過(guò)程,即便只采集稀疏的信號(hào),也能繪出高精度圖像,時(shí)間可從原來(lái)的十分鐘縮短到兩三分鐘;拍CT即便降低放射劑量,利用AI也能生成高精度圖像。
看著拍出的片子,患者往往不知所以然。這些醫(yī)學(xué)影像,只用黑白兩色就描繪了鮮艷的人體器官,色彩轉(zhuǎn)譯成深淺不一的灰色音階。隨著機(jī)器學(xué)習(xí),尤其是卷積神經(jīng)網(wǎng)絡(luò)(CNN)的興起,醫(yī)學(xué)影像成為AI最早應(yīng)用到臨床的實(shí)例,國(guó)內(nèi)外亦涌現(xiàn)出眾多醫(yī)療影像的算法競(jìng)賽。
盡管AI剛?cè)刖轴t(yī)學(xué)影像的時(shí)候,醫(yī)生并不廣泛認(rèn)可相比前代算法,AI能帶來(lái)革命性的變化。但很快,在肺結(jié)節(jié)檢出、糖尿病眼底病變篩查、皮膚癌早期診斷等幾個(gè)特定任務(wù)上,AI的準(zhǔn)確率出現(xiàn)了突破性改變,“在肺結(jié)節(jié)檢出這個(gè)特定任務(wù)上,AI幾乎可以達(dá)到最頂尖醫(yī)生的水平”。
倪東認(rèn)為,理論上AI對(duì)經(jīng)驗(yàn)不太豐富的醫(yī)生更有幫助,但需要可視化引導(dǎo),降低成本是技術(shù)可及的關(guān)鍵。從2019年開(kāi)始,他們一直在研究NiCE平臺(tái),希望在CPU平臺(tái)、Pad、手機(jī)等上面部署非常復(fù)雜的人工智能,做到實(shí)時(shí)分析。這一平臺(tái)面向貧困地區(qū),可以讓醫(yī)生用更低的成本就能實(shí)現(xiàn)AI輔助超聲診斷。
作為胸外科大夫,陳修遠(yuǎn)最主要的判斷是結(jié)節(jié)是否應(yīng)該手術(shù)切除,在遵守診療指南的基礎(chǔ)上,AI相比人的優(yōu)勢(shì)是更量化。醫(yī)生和病人溝通時(shí),往往會(huì)采用一些模糊的說(shuō)法以表示不確定性,例如“大概率是腫瘤,不除外良性”,但是AI則擅長(zhǎng)通過(guò)量化指標(biāo)來(lái)表示結(jié)果的多樣性,例如“腫瘤可能性是89.3%”,這對(duì)相當(dāng)一部分病人而言,更有助于決策。
AI檢出率提升也帶來(lái)困惑。所有結(jié)節(jié)無(wú)論大小,卷積神經(jīng)網(wǎng)絡(luò)可以全部檢出,但過(guò)多的信息可能對(duì)醫(yī)生的決策造成干擾,并對(duì)患者的心理造成影響。面對(duì)這種困境,現(xiàn)行的方法是以結(jié)節(jié)的直徑作為分水嶺,例如:0-3毫米不報(bào)、3-5毫米報(bào)給醫(yī)生、5毫米以上報(bào)給患者,有效平衡算法的靈敏度與臨床的必要性。陳修遠(yuǎn)認(rèn)為,生成式AI可能為解決這個(gè)問(wèn)題發(fā)揮一定的作用,但究竟會(huì)提升醫(yī)生和算法的溝通效率,還是增加溝通成本,仍需探索。
當(dāng)AI和醫(yī)生出現(xiàn)分歧
患者拿到放射科開(kāi)出的報(bào)告,往往會(huì)回到?圃\室,等待醫(yī)生診斷。
把AI用作診斷,準(zhǔn)確率是繞不開(kāi)的話題,人們覺(jué)得醫(yī)療上出錯(cuò)往往是“不能容忍的”。雖然谷歌開(kāi)發(fā)的大模型Med-Gemini在MedQA(基于美國(guó)醫(yī)師執(zhí)照考試的數(shù)據(jù)集)取得91.1%的準(zhǔn)確率,但人們還是會(huì)經(jīng)常說(shuō)一句“大模型會(huì)出錯(cuò),要核查重要信息”。
為了讓AI權(quán)威,微醫(yī)上海人工智能醫(yī)院院長(zhǎng)張群華指出,需要經(jīng)過(guò)多個(gè)步驟驗(yàn)證,由企業(yè)和三甲醫(yī)院一同合作,經(jīng)過(guò)專家反復(fù)使用驗(yàn)證、大數(shù)據(jù)迭代,再通過(guò)多學(xué)科多中心驗(yàn)證,這樣的產(chǎn)品才具有臨床指導(dǎo)意義!搬t(yī)療AI一定是集醫(yī)生經(jīng)驗(yàn)之精華和數(shù)據(jù)、算法三位一體的產(chǎn)品。”
陳修遠(yuǎn)認(rèn)為,在整個(gè)醫(yī)療過(guò)程中,不同流程之間相互重疊,每個(gè)關(guān)鍵決策都有多個(gè)步驟反復(fù)驗(yàn)證,而AI只是支持其中的一小部分步驟,如果產(chǎn)生錯(cuò)誤,很容易發(fā)現(xiàn)!懊恳粋(gè)新的步驟都在持續(xù)對(duì)之前步驟糾錯(cuò),在臨床工作架構(gòu)不改變的情況下,保持醫(yī)生在診療過(guò)程中的主導(dǎo)地位,AI輔助甚至替代個(gè)別步驟,并不會(huì)因?yàn)锳I錯(cuò)誤產(chǎn)生災(zāi)難性后果!
問(wèn)題在于,醫(yī)生要如何發(fā)現(xiàn)AI錯(cuò)了?尤其是,AI輔助診斷的優(yōu)勢(shì)之一是實(shí)現(xiàn)基層醫(yī)療同質(zhì)化,如果經(jīng)驗(yàn)欠缺的醫(yī)生看到AI的答案與自己的判斷有出入時(shí)該怎么辦?倪東認(rèn)為,如果醫(yī)生水平不高,AI也存在誤導(dǎo)的可能。
這是一組矛盾:當(dāng)AI和醫(yī)生出現(xiàn)分歧,如果醫(yī)生忽略,AI就沒(méi)有價(jià)值;醫(yī)生若完全接受,可能會(huì)削弱其權(quán)威和責(zé)任。畢竟AI沒(méi)有行醫(yī)執(zhí)照,所有診斷書(shū)都要醫(yī)生簽字!柏(zé)任主體是醫(yī)生,這一點(diǎn)未來(lái)10年、20年都不會(huì)變!睆埲喝A說(shuō)。
現(xiàn)在看,“黑箱”有被打開(kāi)的希望。OpenAI o1能夠模擬人類長(zhǎng)鏈條推理思考,給出決策鏈條,但生成的時(shí)間變慢了。
對(duì)于生成式模型的可解釋性,馬為之提到,常見(jiàn)的有三種不同實(shí)現(xiàn)方式:一是結(jié)果過(guò)程同步完成,例如思維鏈技術(shù);二是有結(jié)果之后再補(bǔ)足過(guò)程,根據(jù)結(jié)果使用額外模型生成解釋;三是結(jié)果過(guò)程同步完成生成后,再進(jìn)行后校驗(yàn),保證準(zhǔn)確性!叭绻P偷臏(zhǔn)確率足夠高,哪怕不能給出完整的推理細(xì)節(jié),我是不是也能采用輸出的答案?這是一個(gè)容忍度問(wèn)題。”
AI輔助的三維重建是一個(gè)例子。人體是三維的,CT是二維的,從二維到三維需要醫(yī)生在自己大腦中重建影像。2022年開(kāi)始,陳修遠(yuǎn)和團(tuán)隊(duì)一起開(kāi)展了為期兩年的多中心臨床試驗(yàn),結(jié)果說(shuō)明,AI的輔助可以有效提升手術(shù)規(guī)劃的準(zhǔn)確率和時(shí)間效率。而且,他還發(fā)現(xiàn)了不少自己之前認(rèn)知錯(cuò)誤的地方,“從二維到三維想象是件很難的事”。
從2019年到現(xiàn)在,陳修遠(yuǎn)所在科室已有1/3的手術(shù)病人接受了AI三維重建!叭绻麤](méi)有三維重建,一些比較復(fù)雜的手術(shù)在開(kāi)始的初期可能會(huì)有很大的阻力,有這項(xiàng)技術(shù)后,醫(yī)生手術(shù)的信心增強(qiáng)了。”
AI醫(yī)生會(huì)診
當(dāng)遇到復(fù)雜病癥,醫(yī)生難以應(yīng)對(duì)之時(shí)怎么辦?現(xiàn)實(shí)中,往往需要科室專家協(xié)力,或者多學(xué)科聯(lián)合會(huì)診(MDT)。
AI醫(yī)生能否會(huì)診?在馬為之的設(shè)想中,不同專精能力的AI醫(yī)生能像人類醫(yī)生一樣,再把智力資源匯聚起來(lái),實(shí)現(xiàn)AI醫(yī)生會(huì)診。他們發(fā)現(xiàn),多個(gè)智能體在針對(duì)同一個(gè)病例會(huì)診時(shí),推理過(guò)程和得出的結(jié)論,比單個(gè)智能體更強(qiáng)。但是在醫(yī)療應(yīng)用場(chǎng)景下,決策不僅要保證準(zhǔn)確性,還需要交互能力和人情味,需要醫(yī)生和患者雙雙接受。
現(xiàn)在AI已在特定模態(tài)的特定任務(wù)上取得了專業(yè)表現(xiàn),但將各部分能力結(jié)合,構(gòu)建多模態(tài)醫(yī)療AI尚是難點(diǎn)。馬為之認(rèn)為,由一個(gè)統(tǒng)一模型完成不同任務(wù)在技術(shù)上仍有挑戰(zhàn)性,至少在部分任務(wù)上效果上沒(méi)有單個(gè)模型好。“我們?cè)诩夹g(shù)路線上可以做一些優(yōu)化,把醫(yī)生智能體作為決策大腦,再將傳統(tǒng)的影像診斷等模型作為工具,用有很強(qiáng)推理能力的大腦調(diào)用其他的工具模型獲得信息,最后做出決策!
在此過(guò)程中,上述醫(yī)療智能體還將被賦予擁有記憶和經(jīng)驗(yàn)積累的能力,像人類醫(yī)生一樣,在任務(wù)的解決過(guò)程中學(xué)習(xí)進(jìn)步。如果AI病人能滿足超擬人、廣分布和多樣化的條件,那么AI醫(yī)生診治的AI患者數(shù)量越多,能力就會(huì)變得越強(qiáng)。
一位醫(yī)療AI研發(fā)人員告訴南方周末記者,他期待未來(lái)有一個(gè)AI for Science(AI驅(qū)動(dòng)的科學(xué)研究)或AI for Medical(AI驅(qū)動(dòng)的醫(yī)學(xué)研究)的底座,滿足醫(yī)療領(lǐng)域極高的專業(yè)需求,但問(wèn)題在于,如果用專業(yè)數(shù)據(jù),會(huì)面臨數(shù)據(jù)小、與真實(shí)世界脫節(jié)問(wèn)題;若使用真實(shí)世界數(shù)據(jù),面臨數(shù)據(jù)真實(shí)性和隱私性問(wèn)題;若將二者結(jié)合,也可能會(huì)面臨很大困難。
清華AI醫(yī)院中目前有超50萬(wàn)“合成數(shù)據(jù)”構(gòu)造的虛擬患者用大模型、知識(shí)庫(kù)和少量案例生成的虛擬數(shù)據(jù)。生成過(guò)程中,保證患者的表現(xiàn)符合醫(yī)學(xué)規(guī)律。基于健康醫(yī)療數(shù)據(jù)使用有種種限制,合成數(shù)據(jù)被看作是隱私保護(hù)的方法之一,但亦存爭(zhēng)議,比如如果模型過(guò)擬合(在訓(xùn)練數(shù)據(jù)良好但在測(cè)試數(shù)據(jù)表現(xiàn)不佳)或生成不現(xiàn)實(shí)的數(shù)據(jù),會(huì)限制實(shí)用性,還可能會(huì)放大真實(shí)數(shù)據(jù)中的偏差。
生成醫(yī)療數(shù)據(jù)似乎存在一個(gè)悖論!叭绻P涂梢陨梢约賮y真的數(shù)據(jù),那說(shuō)明模型已經(jīng)足夠了解人體,那么生成的數(shù)據(jù)就已不再重要!睌(shù)據(jù)隱私也是陳修遠(yuǎn)關(guān)注的課題之一,現(xiàn)在訓(xùn)練模型的數(shù)據(jù)限制在院內(nèi),他們正在分析什么數(shù)據(jù)可以以何種形式參與院外更大規(guī)模的訓(xùn)練,“隨著模型的算法復(fù)雜程度和訓(xùn)練的硬件需求越來(lái)越高,在院內(nèi)訓(xùn)練甚至在院內(nèi)部署模型都將難以實(shí)現(xiàn)”。
醫(yī)療AI究竟如何使用?世界衛(wèi)生組織在指南《醫(yī)療衛(wèi)生中AI使用的倫理和管治》給出樂(lè)觀、悲觀兩種觀點(diǎn),前者認(rèn)為會(huì)減輕醫(yī)生負(fù)擔(dān),投身更有挑戰(zhàn)性的工作,后者認(rèn)為會(huì)減少工作崗位。張群華曾問(wèn)許多醫(yī)生,心目中的AI應(yīng)該是怎樣的,大家的共識(shí)是:AI應(yīng)當(dāng)是醫(yī)生的左手,擁抱AI的醫(yī)生比不擁抱AI的醫(yī)生,更能讓患者受益。
(南方周末記者黃思卓、實(shí)習(xí)生劉圓圓對(duì)本文亦有貢獻(xiàn)。)
南方周末記者 宋炳晨
責(zé)編 曹海東