編者按:近日,首都科技領(lǐng)軍人才、東方通科技首席科學(xué)家謝耘在通州全球發(fā)展論壇(2025年春季)“DeepSeek中國(guó)人工智能、跳躍式發(fā)展與全球2050目標(biāo)”主題研討會(huì)上發(fā)言指出,未來(lái)大模型應(yīng)聚焦邊界明確的問(wèn)題領(lǐng)域,避免處理無(wú)限開(kāi)放性問(wèn)題,同時(shí)需以理性態(tài)度看待AI發(fā)展,而不是用感性的期望想象,代替理性的分析認(rèn)識(shí),F(xiàn)將其發(fā)言實(shí)錄發(fā)布如下:
大模型的基礎(chǔ)是什么?
我從科學(xué)的角度講一下對(duì)于大模型的看法。大模型的基礎(chǔ)是什么?講一下這兩個(gè)核心的基礎(chǔ)。因?yàn)橐粋(gè)東西的基礎(chǔ),決定其能做什么,能走多遠(yuǎn),所以我們還要理解它的基礎(chǔ)。大模型核心的基礎(chǔ)是基于文字符號(hào)的統(tǒng)計(jì),它是對(duì)文字符號(hào)做統(tǒng)計(jì)來(lái)做各種各樣的事情的,這是它的核心基礎(chǔ)。通過(guò)統(tǒng)計(jì)來(lái)發(fā)現(xiàn)文字符號(hào)之間概率的關(guān)系,借助這個(gè)概率關(guān)系生成你需要的東西。簡(jiǎn)單講一下統(tǒng)計(jì),統(tǒng)計(jì)的方法在科學(xué)中屬于一種相對(duì)平凡的方法,為什么說(shuō)是相對(duì)平凡的方法?它是一個(gè)就事論事的方法,沒(méi)有辦法超越統(tǒng)計(jì)的樣本,去談別的事情。它做不到,這是統(tǒng)計(jì)原理上根本的限制。舉一個(gè)最簡(jiǎn)單的例子,當(dāng)年開(kāi)普勒通過(guò)統(tǒng)計(jì)行星圍繞太陽(yáng)運(yùn)行的數(shù)據(jù),發(fā)現(xiàn)了行星軌道的特點(diǎn)。但是,他不可能通過(guò)統(tǒng)計(jì),去發(fā)現(xiàn)兩個(gè)質(zhì)量相同的星體相互運(yùn)動(dòng)的規(guī)律。不可能統(tǒng)計(jì)出來(lái),因?yàn)闆](méi)包含在那個(gè)數(shù)據(jù)里。他更不可能,通過(guò)統(tǒng)計(jì)產(chǎn)生超越數(shù)據(jù)的洞察。比如行星圍繞太陽(yáng)轉(zhuǎn)是萬(wàn)有引力決定的,他通過(guò)這個(gè)數(shù)據(jù)統(tǒng)計(jì)沒(méi)有辦法推出萬(wàn)有引力定律,所以萬(wàn)有引力定律最后是牛頓提出來(lái)的。牛頓不是用統(tǒng)計(jì)的方法,其實(shí)這是一種洞察的能力。對(duì)于洞察我們沒(méi)有辦法詳細(xì)解釋?zhuān)晕覀冋f(shuō)一個(gè)蘋(píng)果砸到牛頓的腦袋上,讓他發(fā)現(xiàn)了萬(wàn)有引力定律,這種深刻的洞察沒(méi)有辦法通過(guò)統(tǒng)計(jì)發(fā)現(xiàn)。所以統(tǒng)計(jì)是科學(xué)中一種相對(duì)平凡的方法。人工智能開(kāi)始并不是依賴(lài)統(tǒng)計(jì),而是試過(guò)很多其它的方法,結(jié)果發(fā)現(xiàn)只有統(tǒng)計(jì)最好用。所以現(xiàn)在人工智能使用統(tǒng)計(jì)這個(gè)平凡的方法是沒(méi)辦法的辦法。大模型的第二個(gè)基礎(chǔ)是什么?這是被談?wù)摰母俚囊粋(gè)話題,其實(shí)這個(gè)更本質(zhì),大模型本質(zhì)是一種現(xiàn)代工匠技藝。為什么說(shuō)是一種工匠技藝?因?yàn)樗鼪](méi)有背后的科學(xué)原理,人類(lèi)現(xiàn)在沒(méi)有關(guān)于智能的科學(xué)理論。所以人工智能現(xiàn)在都是工匠性的實(shí)驗(yàn)方法,為什么DeepSeek搞出一個(gè)東西大家很驚訝?就是因?yàn)檫@是一個(gè)工匠的東西。如果你有新的想法,你也可以搞出新的東西來(lái),并不是某一個(gè)理論告訴你一定會(huì)怎么樣,不存在這個(gè)理論。所以這是大模型,是人工智能非常本質(zhì)的一件事情,它是現(xiàn)代工匠技藝。有很多朋友不理解這件事情,說(shuō)用了那么復(fù)雜的數(shù)學(xué),你怎么說(shuō)它是工匠?對(duì)不起,數(shù)學(xué)只是個(gè)工具,用了再?gòu)?fù)雜的數(shù)學(xué),也不等于是科學(xué)。為什么說(shuō)它是現(xiàn)代工匠技藝?就是因?yàn)橛昧舜罅康臄?shù)學(xué),和傳統(tǒng)的工匠技藝不一樣,只是后者用手,這是第二個(gè)核心的基礎(chǔ)。這兩個(gè)基礎(chǔ)決定了它能做什么,不能做什么,也決定了未來(lái)能發(fā)展到哪里,以及以什么形式去發(fā)展,F(xiàn)代工匠技藝有幾個(gè)特點(diǎn):
一是有很大的盲目性,因?yàn)闆](méi)有科學(xué)理論做指導(dǎo);二是有很大的不確定性,新的方法可能突然出現(xiàn)取代已有的;三是工匠技藝和有現(xiàn)代科學(xué)理論支撐的技術(shù)發(fā)展相比,它可能走不太遠(yuǎn),這是歷史的經(jīng)驗(yàn)告訴我們的;四是工匠技藝嚴(yán)重地依賴(lài)經(jīng)驗(yàn)和悟性,是個(gè)經(jīng)驗(yàn)的東西。關(guān)于人工智能,美國(guó)蘭德公司1965年就有一個(gè)報(bào)告,講了一個(gè)非常核心的觀點(diǎn),就是人工智能是一種現(xiàn)代煉金術(shù),沒(méi)有科學(xué)的理論在支撐,這個(gè)結(jié)論到今天依然是成立的,這個(gè)領(lǐng)域依然如此。報(bào)告里面一個(gè)很形象的話送給大家,你不能因?yàn)榕赖搅艘粋(gè)很高的樹(shù)上,就覺(jué)得自己離登月這個(gè)目標(biāo)更近了。這是1965年的報(bào)告,大家有興趣可以查,網(wǎng)上能找到這份報(bào)告。
大模型與人的異同
大家現(xiàn)在在講大模型有理解能力,大模型的理解是基于字符的統(tǒng)計(jì)形成的,它和人基于意義的理解是不一樣的,底層邏輯完全不同。這樣兩種東西產(chǎn)生的結(jié)果會(huì)有重疊的地方,但是注定不完全一樣,這兩個(gè)機(jī)制是不等價(jià)的。所以大模型產(chǎn)生幻覺(jué)是必然的,幻覺(jué)只是站在人的角度去說(shuō),對(duì)于大模型來(lái)講,這就是它非常正常的輸出。因?yàn)榘凑账讓拥臋C(jī)制,就會(huì)產(chǎn)生這些東西。所以它的理解和我們的理解在結(jié)果上有重疊的部分,但是不等價(jià),一定有很多不一樣的地方。關(guān)于邏輯,現(xiàn)在很多人問(wèn)大模型的邏輯能力,大模型底層沒(méi)有邏輯,還是基于概率統(tǒng)計(jì)的。他基于概率統(tǒng)計(jì)輸出的東西,從邏輯角度,和我們的邏輯可以重合,但是依然是不等價(jià)的。你用再多的數(shù)據(jù)訓(xùn)練,這兩個(gè)也不可能等價(jià),因?yàn)榈讓訖C(jī)制不一樣,這個(gè)不是數(shù)據(jù)決定的,這是底層機(jī)制決定的。很多人說(shuō)大模型會(huì)犯錯(cuò)誤,人也會(huì)犯錯(cuò)誤,這有什么了不起的?這兩個(gè)犯的錯(cuò)誤不一樣。人犯的錯(cuò)誤某種程度上是可預(yù)測(cè)的。比如說(shuō)王院長(zhǎng),在他的領(lǐng)域里面他談的東西不可能出基本概念的錯(cuò)誤,否則王院長(zhǎng)不可能當(dāng)院長(zhǎng),在國(guó)際上做這么多講座。人的錯(cuò)誤當(dāng)他達(dá)到一定水平,有些錯(cuò)誤不會(huì)犯。高水平的人依然會(huì)犯錯(cuò)誤,但是不會(huì)犯基本的錯(cuò)誤。但大模型不是,大模型無(wú)法預(yù)測(cè)會(huì)犯什么類(lèi)型的錯(cuò)誤。就是因?yàn)榈讓拥臋C(jī)制不一樣,它不是按照我們的理解去看這個(gè)事情。國(guó)際上有很多測(cè)試,發(fā)現(xiàn)你再增加數(shù)據(jù),它依然會(huì)在很基本的問(wèn)題上犯錯(cuò),所以它出錯(cuò)和人出錯(cuò)的性質(zhì)不一樣。我清華的一個(gè)朋友問(wèn)我大模型能不能展示出智慧?我說(shuō)你要首先定義什么是智慧,你沒(méi)定義智慧沒(méi)法談會(huì)不會(huì)有智慧。
未來(lái)的發(fā)展
最后講一下未來(lái)的發(fā)展,人工智能的科學(xué)原理會(huì)不會(huì)有突破?我個(gè)人對(duì)于這個(gè)事情不看好。原因就是人類(lèi)最聰明的一批大腦,研究智能科學(xué)已經(jīng)研究了上百年,到今天沒(méi)有突破。科學(xué)界對(duì)大腦,對(duì)意識(shí)的一個(gè)基本結(jié)論就是,人類(lèi)一公斤多重的大腦是現(xiàn)代科學(xué)最深的一個(gè)黑洞。所以你說(shuō)未來(lái)會(huì)有突破,這個(gè)會(huì)很難,我覺(jué)得希望不是太大。工匠技藝可以走多遠(yuǎn),這個(gè)不太好預(yù)測(cè),但是它會(huì)出現(xiàn)很低效率的發(fā)展,工匠技藝在盲目地摸索,這里有很大的偶然性。工匠技藝創(chuàng)新的模式可能是孤狼式的,因?yàn)闆](méi)有科學(xué)理論的指導(dǎo),讓大家都按照一個(gè)方向走。有可能今天DeepSeek用了一個(gè)低成本的方式做,有可能過(guò)兩天一個(gè)人用完全不同的方式做出一個(gè)新的東西來(lái),這完全是有可能的。所以這個(gè)領(lǐng)域的創(chuàng)新其實(shí)恰恰應(yīng)該鼓勵(lì)大家不要沿著一個(gè)潮流去走,而是應(yīng)該鼓勵(lì)多方向去探索。未來(lái)人工智能,包括大模型的發(fā)展,我個(gè)人認(rèn)為以問(wèn)題邊界受限的領(lǐng)域應(yīng)用為主可能會(huì)更好。因?yàn)橐坏╅_(kāi)放,問(wèn)題就不受限了,可以有一個(gè)無(wú)窮的問(wèn)題。你用有限的學(xué)習(xí)樣本的統(tǒng)計(jì)去解決無(wú)窮的問(wèn)題,這是有問(wèn)題的。所以用有限的統(tǒng)計(jì)方法,還應(yīng)該去解決有限、受限的問(wèn)題,我覺(jué)得這是最好的方式。最后一個(gè)建議,面對(duì)人工智能大模型的發(fā)展,我們還是要用科學(xué)的態(tài)度去面對(duì),而不是用感性的期望和自己的想象來(lái)解釋這里的事情。現(xiàn)在這個(gè)問(wèn)題比較嚴(yán)重,我覺(jué)得還是要用理性的態(tài)度去面對(duì)這件事情。人類(lèi)整個(gè)歷史其實(shí)說(shuō)明一個(gè)很重要的問(wèn)題,就是理性導(dǎo)致我們走到今天?茖W(xué)就是一個(gè)理性的產(chǎn)物,沒(méi)有理性我們是走不到今天的,所以我們往未來(lái)看,我想可能還是應(yīng)該強(qiáng)調(diào)科學(xué)的理性去面對(duì)這件事情,用科學(xué)負(fù)責(zé)任的態(tài)度去發(fā)展使用人工智能技術(shù)。謝謝大家!