人類一直夢想著能夠直接通過思想與機(jī)器溝通。在科幻電影《黑客帝國》中,人類通過腦機(jī)接口直接將意識上傳至數(shù)字世界;《三體》中的“思想鋼印”則通過腦電波操控人類信念。如今,這些幻想正在被人工智能大模型逐步解構(gòu)為現(xiàn)實(shí)。一場關(guān)于“讀心術(shù)”的科技革命正在悄然展開。
人腦僅重約1.4千克,卻承載著人類意識、記憶與創(chuàng)造力的終極奧秘。這個(gè)由860億神經(jīng)元、百萬億突觸連接構(gòu)成的神經(jīng)網(wǎng)絡(luò),每秒鐘進(jìn)行著數(shù)萬億次電化學(xué)信號的傳遞,其復(fù)雜程度讓最先進(jìn)的超級計(jì)算機(jī)也相形見絀。
一般來說,檢測大腦活動(dòng)的手段有腦磁圖(magnetoencephalography,簡稱MEG)、腦電圖(electroencephalography,簡稱EEG)、功能性磁共振成像(functionalmagnetic resonanceimaging,簡稱fMRI)等,雖然這些技術(shù)能夠捕捉到大腦活動(dòng)的一些跡象,但對于深入理解大腦的工作機(jī)制,仍然顯得力不從心。
最近,基于大語言模型(LLM,Large LanguageModel)的神經(jīng)解碼技術(shù)取得了突破性進(jìn)展,耶魯大學(xué)、達(dá)特茅斯學(xué)院和劍橋大學(xué)的研究人員開發(fā)了一種模型MindLLM,可以將功能性磁共振成像(fMRI)信號解碼為文本。簡單來說,就是MindLLM可以讀懂你的大腦在想什么,并用文字描述出來。
這項(xiàng)研究將神經(jīng)科學(xué)的注意力機(jī)制與大型語言模型(LLM)相結(jié)合,通過創(chuàng)新的方法提高了從fMRI信號中捕獲多種語義的能力與準(zhǔn)確性,對神經(jīng)科學(xué)和腦機(jī)接口應(yīng)用具有重要意義。
MindLLM如何“讀心”
MindLLM的設(shè)計(jì)包括一個(gè)fMRI編碼器和一個(gè)大型語言模型。
首先,fMRI掃描將大腦劃分為稱為體素(voxels,類似于3D像素)的微小3D單元。因?yàn)椴煌说拇竽X結(jié)構(gòu)不同,所以當(dāng)我們運(yùn)用標(biāo)準(zhǔn)化大腦圖譜比對時(shí),會(huì)出現(xiàn)很大的差異化結(jié)果,因此每個(gè)受試者需要不同的輸入維度。
由于大腦功能在個(gè)體之間保持一致,即使體素分布不同,也有可能獲取同樣的信息。研究者們?yōu)榇嗽O(shè)計(jì)了一種具有注意力機(jī)制的fMRI編碼器,可以適應(yīng)不同的體素值,將體素的功能信息從原始差異化的fMRI數(shù)值中分離出來,從而提高了個(gè)體之間的一致性。
而要實(shí)現(xiàn)通用的fMRI到文本解碼,需要一個(gè)合適的腦指令調(diào)諧(BrainInstruction Tuning,簡稱BIT)數(shù)據(jù)集,運(yùn)用大模型LLM處理大量與圖像相關(guān)的fMRI數(shù)據(jù),并與相關(guān)的文本注釋相關(guān)聯(lián),進(jìn)一步增強(qiáng)了系統(tǒng)從fMRI信號中提取不同語義表征的能力。
fMRI數(shù)據(jù)包括受試者執(zhí)行一些任務(wù)時(shí)的腦部掃描信息,這些任務(wù)包括讓受試者查看圖像并回答有關(guān)的簡單問題。例如,給定一幅旁邊有一些字母的時(shí)鐘圖像,受試者的任務(wù)可能是確定圖像中的字母。又比如給定一幅棒球運(yùn)動(dòng)員投擲動(dòng)作的圖像,受試者則可能被問及投擲的是什么物體。
因此,只要給定fMRI數(shù)據(jù),MindLLM就能生成文字,描述掃描到的大腦活動(dòng)。
MindLLM的核心突破可以理解為給AI裝上了兩套“思維翻譯神器”:
首先傳統(tǒng)腦部掃描數(shù)據(jù)就像雜亂無章的無線電波,MindLLM通過引入注意力機(jī)制,對于fMRI數(shù)據(jù)進(jìn)行創(chuàng)新處理,可以自動(dòng)過濾掉干擾信號,精準(zhǔn)鎖定與思維相關(guān)的關(guān)鍵腦區(qū)活動(dòng)。
另一方面,研究人員創(chuàng)建了BIT數(shù)據(jù)集,給AI進(jìn)行了“跨學(xué)科特訓(xùn)”,既學(xué)習(xí)看圖說話,又練習(xí)文字推理。這套包含感知、記憶、語言處理和復(fù)雜推理等模塊的訓(xùn)練體系,相當(dāng)于讓AI掌握了破解不同思維類型的“密碼本”,確保MindLLM可以解碼人類思想的各個(gè)方面。
MindLLM的潛在應(yīng)用意義重大。它可以用于開發(fā)腦機(jī)接口,讓人們能夠用自己的思想控制設(shè)備,從而徹底改變殘疾人的輔助技術(shù)。該模型還可以提供對認(rèn)知過程的見解,幫助研究人員更好地了解大腦是如何工作的。
雖然MindLLM在處理大腦活動(dòng)信號方面展現(xiàn)出了巨大的優(yōu)勢,但該研究仍處于初期階段,只能理解靜態(tài)的圖片,對于動(dòng)態(tài)影像的處理還仍需探索,而且實(shí)際操作需要耗費(fèi)大量的時(shí)間和人力物力,研究僅能存在于實(shí)驗(yàn)室環(huán)境中,對于大規(guī)模實(shí)際應(yīng)用仍存在一定距離。
其他“讀心術(shù)”研究
而在MindLLM之前,科學(xué)界在運(yùn)用人工智能處理大腦活動(dòng)信號方面還有許多其他的探索。
例如Meta推出的Brain2Qwerty通過分析大腦活動(dòng)信號,將人的思維直接轉(zhuǎn)化為文字。研究人員讓受試者佩戴EEG設(shè)備,然后讓他們閱讀或思考一些語句。
Brain2Qwerty通過對這些大腦信號的分析,嘗試將其轉(zhuǎn)化為對應(yīng)的文字輸出。雖然目前該技術(shù)的準(zhǔn)確率還有待提高,但已經(jīng)展示出了將思維轉(zhuǎn)化為文字的可能性,這對于那些因癱瘓等原因無法正常交流的患者來說,無疑是一個(gè)巨大的希望。
德克薩斯大學(xué)奧斯汀分校(Universityof Texas atAustin)的一個(gè)科研團(tuán)隊(duì)也在進(jìn)行類似的研究。他們專注于利用人工智能大模型可以將患者的想法轉(zhuǎn)化為連續(xù)的文字,而無需患者理解口語,這種方法最終可能幫助失語癥患者。
未來應(yīng)用廣泛
雖然目前眾多技術(shù)的準(zhǔn)確率還有待提高,但已經(jīng)展示出了將思維轉(zhuǎn)化為文字的可能性,這對于那些因癱瘓等原因無法正常交流的患者來說,無疑是一個(gè)巨大的希望。
人工智能大模型在處理大腦活動(dòng)信號方面的發(fā)展,具有重大的意義。不僅可以幫助研究者探秘大腦,幫助患者提高生活質(zhì)量,還可能帶來全新的交互方式和生活體驗(yàn),改變我們與周圍世界的互動(dòng)模式。
這種解碼思想的能力長期以來一直是科幻小說的主要內(nèi)容,可能用不了多久它就會(huì)成為科學(xué)事實(shí)。但這種技術(shù)的狂飆也會(huì)帶來很多問題,意識的私密性面臨崩塌風(fēng)險(xiǎn),腦電波可能淪為數(shù)據(jù)流,思維隱私安全如何確保?
Nature的一篇研究曾表明:大模型參數(shù)量越大,越傾向于用虛構(gòu)答案掩蓋無知,這種“腦霧”現(xiàn)象與人腦認(rèn)知衰退的相似性,迫使人類重新審視智能的本質(zhì),如果AI的“幻覺”與人類的創(chuàng)造力同源,我們是否該容忍機(jī)器以錯(cuò)誤探索真理?
參考資料:
[1]https://www.discovermagazine.com/mind/brain-scan-ai-system-can-describe-what-you-see
[2]https://medicalxpress.com/news/2025-02-brain-imaging-text-mindllm.html
[3]https://en.wikipedia.org/wiki/Functional_magnetic_resonance_imaging
[4]AlexHuth and his team create an AI system that can translate brainactivity into text - Texas Connect
[5]https://www.marktechpost.com/2025/02/09/meta-ai-introduces-brain2qwerty-a-new-deep-learning-model-for-decoding-sentences-from-brain-activity-with-eeg-or-meg-while-participants-typed-briefly-memorized-sentences-on-a-qwerty-keyboard/
[6]https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0105225
[7]https://en.wikipedia.org/wiki/Human_brain#Research
[8]JonesN. Bigger AI chatbots more inclined to spew nonsense-and people don'talways realize[J]. Nature, 2024.
編譯:楊雨鑫
策劃:劉穎 張超 李培元 楊柳
審核:蘇湛中國科學(xué)院大學(xué)副教授,歷史系副主任
中國科學(xué)技術(shù)史學(xué)會(huì)科學(xué)文化專委會(huì)主任