當(dāng)前位置：人工智能實(shí)驗(yàn)室> 人工智能應(yīng)用 > 謝耘：AI大模型的基礎(chǔ)、與人的異同及未來(lái)發(fā)展

謝耘：AI大模型的基礎(chǔ)、與人的異同及未來(lái)發(fā)展
來(lái)源：互聯(lián)網(wǎng) 發(fā)布日期：2025-03-02 22:39:42 瀏覽：193次

導(dǎo)讀：編者按：近日，首都科技領(lǐng)軍人才、東方通科技首席科學(xué)家謝耘在通州全球發(fā)展論壇（2025年春季）“DeepSeek中國(guó)人工智能、跳躍式發(fā)展與全球2050目標(biāo)”主題研討會(huì)上發(fā)言指出，未來(lái)大模型應(yīng)聚焦邊界明確的問(wèn)題領(lǐng)域，避免處理無(wú)限開(kāi)放性問(wèn)題，同時(shí)需以理性態(tài)度看待AI發(fā)展，而不是用感性的期望想象，代替理性的分析認(rèn)識(shí)�，F(xiàn)將其發(fā)言實(shí)錄發(fā)布如下：大模型的基礎(chǔ)是什么？我從科學(xué)的角度 ......

編者按：近日，首都科技領(lǐng)軍人才、東方通科技首席科學(xué)家謝耘在通州全球發(fā)展論壇（2025年春季）“DeepSeek中國(guó)人工智能、跳躍式發(fā)展與全球2050目標(biāo)”主題研討會(huì)上發(fā)言指出，未來(lái)大模型應(yīng)聚焦邊界明確的問(wèn)題領(lǐng)域，避免處理無(wú)限開(kāi)放性問(wèn)題，同時(shí)需以理性態(tài)度看待AI發(fā)展，而不是用感性的期望想象，代替理性的分析認(rèn)識(shí)�，F(xiàn)將其發(fā)言實(shí)錄發(fā)布如下：

謝耘：AI大模型的基礎(chǔ)、與人的異同及未來(lái)發(fā)展

大模型的基礎(chǔ)是什么？

我從科學(xué)的角度講一下對(duì)于大模型的看法。大模型的基礎(chǔ)是什么？講一下這兩個(gè)核心的基礎(chǔ)。因?yàn)橐粋€(gè)東西的基礎(chǔ)，決定其能做什么，能走多遠(yuǎn)，所以我們還要理解它的基礎(chǔ)。大模型核心的基礎(chǔ)是基于文字符號(hào)的統(tǒng)計(jì)，它是對(duì)文字符號(hào)做統(tǒng)計(jì)來(lái)做各種各樣的事情的，這是它的核心基礎(chǔ)。通過(guò)統(tǒng)計(jì)來(lái)發(fā)現(xiàn)文字符號(hào)之間概率的關(guān)系，借助這個(gè)概率關(guān)系生成你需要的東西。簡(jiǎn)單講一下統(tǒng)計(jì)，統(tǒng)計(jì)的方法在科學(xué)中屬于一種相對(duì)平凡的方法，為什么說(shuō)是相對(duì)平凡的方法？它是一個(gè)就事論事的方法，沒(méi)有辦法超越統(tǒng)計(jì)的樣本，去談別的事情。它做不到，這是統(tǒng)計(jì)原理上根本的限制。舉一個(gè)最簡(jiǎn)單的例子，當(dāng)年開(kāi)普勒通過(guò)統(tǒng)計(jì)行星圍繞太陽(yáng)運(yùn)行的數(shù)據(jù)，發(fā)現(xiàn)了行星軌道的特點(diǎn)。但是，他不可能通過(guò)統(tǒng)計(jì)，去發(fā)現(xiàn)兩個(gè)質(zhì)量相同的星體相互運(yùn)動(dòng)的規(guī)律。不可能統(tǒng)計(jì)出來(lái)，因?yàn)闆](méi)包含在那個(gè)數(shù)據(jù)里。他更不可能，通過(guò)統(tǒng)計(jì)產(chǎn)生超越數(shù)據(jù)的洞察。比如行星圍繞太陽(yáng)轉(zhuǎn)是萬(wàn)有引力決定的，他通過(guò)這個(gè)數(shù)據(jù)統(tǒng)計(jì)沒(méi)有辦法推出萬(wàn)有引力定律，所以萬(wàn)有引力定律最后是牛頓提出來(lái)的。牛頓不是用統(tǒng)計(jì)的方法，其實(shí)這是一種洞察的能力。對(duì)于洞察我們沒(méi)有辦法詳細(xì)解釋?zhuān)晕覀冋f(shuō)一個(gè)蘋(píng)果砸到牛頓的腦袋上，讓他發(fā)現(xiàn)了萬(wàn)有引力定律，這種深刻的洞察沒(méi)有辦法通過(guò)統(tǒng)計(jì)發(fā)現(xiàn)。所以統(tǒng)計(jì)是科學(xué)中一種相對(duì)平凡的方法。人工智能開(kāi)始并不是依賴(lài)統(tǒng)計(jì)，而是試過(guò)很多其它的方法，結(jié)果發(fā)現(xiàn)只有統(tǒng)計(jì)最好用。所以現(xiàn)在人工智能使用統(tǒng)計(jì)這個(gè)平凡的方法是沒(méi)辦法的辦法。大模型的第二個(gè)基礎(chǔ)是什么？這是被談?wù)摰母俚囊粋€(gè)話題，其實(shí)這個(gè)更本質(zhì)，大模型本質(zhì)是一種現(xiàn)代工匠技藝。為什么說(shuō)是一種工匠技藝？因?yàn)樗鼪](méi)有背后的科學(xué)原理，人類(lèi)現(xiàn)在沒(méi)有關(guān)于智能的科學(xué)理論。所以人工智能現(xiàn)在都是工匠性的實(shí)驗(yàn)方法，為什么DeepSeek搞出一個(gè)東西大家很驚訝？就是因?yàn)檫@是一個(gè)工匠的東西。如果你有新的想法，你也可以搞出新的東西來(lái)，并不是某一個(gè)理論告訴你一定會(huì)怎么樣，不存在這個(gè)理論。所以這是大模型，是人工智能非常本質(zhì)的一件事情，它是現(xiàn)代工匠技藝。有很多朋友不理解這件事情，說(shuō)用了那么復(fù)雜的數(shù)學(xué)，你怎么說(shuō)它是工匠？對(duì)不起，數(shù)學(xué)只是個(gè)工具，用了再?gòu)?fù)雜的數(shù)學(xué)，也不等于是科學(xué)。為什么說(shuō)它是現(xiàn)代工匠技藝？就是因?yàn)橛昧舜罅康臄?shù)學(xué)，和傳統(tǒng)的工匠技藝不一樣，只是后者用手，這是第二個(gè)核心的基礎(chǔ)。這兩個(gè)基礎(chǔ)決定了它能做什么，不能做什么，也決定了未來(lái)能發(fā)展到哪里，以及以什么形式去發(fā)展�，F(xiàn)代工匠技藝有幾個(gè)特點(diǎn)：

一是有很大的盲目性，因?yàn)闆](méi)有科學(xué)理論做指導(dǎo)；二是有很大的不確定性，新的方法可能突然出現(xiàn)取代已有的；三是工匠技藝和有現(xiàn)代科學(xué)理論支撐的技術(shù)發(fā)展相比，它可能走不太遠(yuǎn)，這是歷史的經(jīng)驗(yàn)告訴我們的；四是工匠技藝嚴(yán)重地依賴(lài)經(jīng)驗(yàn)和悟性，是個(gè)經(jīng)驗(yàn)的東西。關(guān)于人工智能，美國(guó)蘭德公司1965年就有一個(gè)報(bào)告，講了一個(gè)非常核心的觀點(diǎn)，就是人工智能是一種現(xiàn)代煉金術(shù)，沒(méi)有科學(xué)的理論在支撐，這個(gè)結(jié)論到今天依然是成立的，這個(gè)領(lǐng)域依然如此。報(bào)告里面一個(gè)很形象的話送給大家，你不能因?yàn)榕赖搅艘粋€(gè)很高的樹(shù)上，就覺(jué)得自己離登月這個(gè)目標(biāo)更近了。這是1965年的報(bào)告，大家有興趣可以查，網(wǎng)上能找到這份報(bào)告。

大模型與人的異同

大家現(xiàn)在在講大模型有理解能力，大模型的理解是基于字符的統(tǒng)計(jì)形成的，它和人基于意義的理解是不一樣的，底層邏輯完全不同。這樣兩種東西產(chǎn)生的結(jié)果會(huì)有重疊的地方，但是注定不完全一樣，這兩個(gè)機(jī)制是不等價(jià)的。所以大模型產(chǎn)生幻覺(jué)是必然的，幻覺(jué)只是站在人的角度去說(shuō)，對(duì)于大模型來(lái)講，這就是它非常正常的輸出。因?yàn)榘凑账讓拥臋C(jī)制，就會(huì)產(chǎn)生這些東西。所以它的理解和我們的理解在結(jié)果上有重疊的部分，但是不等價(jià)，一定有很多不一樣的地方。關(guān)于邏輯，現(xiàn)在很多人問(wèn)大模型的邏輯能力，大模型底層沒(méi)有邏輯，還是基于概率統(tǒng)計(jì)的。他基于概率統(tǒng)計(jì)輸出的東西，從邏輯角度，和我們的邏輯可以重合，但是依然是不等價(jià)的。你用再多的數(shù)據(jù)訓(xùn)練，這兩個(gè)也不可能等價(jià)，因?yàn)榈讓訖C(jī)制不一樣，這個(gè)不是數(shù)據(jù)決定的，這是底層機(jī)制決定的。很多人說(shuō)大模型會(huì)犯錯(cuò)誤，人也會(huì)犯錯(cuò)誤，這有什么了不起的？這兩個(gè)犯的錯(cuò)誤不一樣。人犯的錯(cuò)誤某種程度上是可預(yù)測(cè)的。比如說(shuō)王院長(zhǎng)，在他的領(lǐng)域里面他談的東西不可能出基本概念的錯(cuò)誤，否則王院長(zhǎng)不可能當(dāng)院長(zhǎng)，在國(guó)際上做這么多講座。人的錯(cuò)誤當(dāng)他達(dá)到一定水平，有些錯(cuò)誤不會(huì)犯。高水平的人依然會(huì)犯錯(cuò)誤，但是不會(huì)犯基本的錯(cuò)誤。但大模型不是，大模型無(wú)法預(yù)測(cè)會(huì)犯什么類(lèi)型的錯(cuò)誤。就是因?yàn)榈讓拥臋C(jī)制不一樣，它不是按照我們的理解去看這個(gè)事情。國(guó)際上有很多測(cè)試，發(fā)現(xiàn)你再增加數(shù)據(jù)，它依然會(huì)在很基本的問(wèn)題上犯錯(cuò)，所以它出錯(cuò)和人出錯(cuò)的性質(zhì)不一樣。我清華的一個(gè)朋友問(wèn)我大模型能不能展示出智慧？我說(shuō)你要首先定義什么是智慧，你沒(méi)定義智慧沒(méi)法談會(huì)不會(huì)有智慧。

未來(lái)的發(fā)展

最后講一下未來(lái)的發(fā)展，人工智能的科學(xué)原理會(huì)不會(huì)有突破？我個(gè)人對(duì)于這個(gè)事情不看好。原因就是人類(lèi)最聰明的一批大腦，研究智能科學(xué)已經(jīng)研究了上百年，到今天沒(méi)有突破。科學(xué)界對(duì)大腦，對(duì)意識(shí)的一個(gè)基本結(jié)論就是，人類(lèi)一公斤多重的大腦是現(xiàn)代科學(xué)最深的一個(gè)黑洞。所以你說(shuō)未來(lái)會(huì)有突破，這個(gè)會(huì)很難，我覺(jué)得希望不是太大。工匠技藝可以走多遠(yuǎn)，這個(gè)不太好預(yù)測(cè)，但是它會(huì)出現(xiàn)很低效率的發(fā)展，工匠技藝在盲目地摸索，這里有很大的偶然性。工匠技藝創(chuàng)新的模式可能是孤狼式的，因?yàn)闆](méi)有科學(xué)理論的指導(dǎo)，讓大家都按照一個(gè)方向走。有可能今天DeepSeek用了一個(gè)低成本的方式做，有可能過(guò)兩天一個(gè)人用完全不同的方式做出一個(gè)新的東西來(lái)，這完全是有可能的。所以這個(gè)領(lǐng)域的創(chuàng)新其實(shí)恰恰應(yīng)該鼓勵(lì)大家不要沿著一個(gè)潮流去走，而是應(yīng)該鼓勵(lì)多方向去探索。未來(lái)人工智能，包括大模型的發(fā)展，我個(gè)人認(rèn)為以問(wèn)題邊界受限的領(lǐng)域應(yīng)用為主可能會(huì)更好。因?yàn)橐坏╅_(kāi)放，問(wèn)題就不受限了，可以有一個(gè)無(wú)窮的問(wèn)題。你用有限的學(xué)習(xí)樣本的統(tǒng)計(jì)去解決無(wú)窮的問(wèn)題，這是有問(wèn)題的。所以用有限的統(tǒng)計(jì)方法，還應(yīng)該去解決有限、受限的問(wèn)題，我覺(jué)得這是最好的方式。最后一個(gè)建議，面對(duì)人工智能大模型的發(fā)展，我們還是要用科學(xué)的態(tài)度去面對(duì)，而不是用感性的期望和自己的想象來(lái)解釋這里的事情。現(xiàn)在這個(gè)問(wèn)題比較嚴(yán)重，我覺(jué)得還是要用理性的態(tài)度去面對(duì)這件事情。人類(lèi)整個(gè)歷史其實(shí)說(shuō)明一個(gè)很重要的問(wèn)題，就是理性導(dǎo)致我們走到今天�？茖W(xué)就是一個(gè)理性的產(chǎn)物，沒(méi)有理性我們是走不到今天的，所以我們往未來(lái)看，我想可能還是應(yīng)該強(qiáng)調(diào)科學(xué)的理性去面對(duì)這件事情，用科學(xué)負(fù)責(zé)任的態(tài)度去發(fā)展使用人工智能技術(shù)。謝謝大家！

相關(guān)熱詞： 謝耘萬(wàn)有引力牛頓通州區(qū) 模型

上一篇：V社新VR頭顯“Deckard”要來(lái)了，售價(jià)超萬(wàn)元！

下一篇：馬斯克：AI毀滅人類(lèi)的風(fēng)險(xiǎn)為20%，未來(lái)結(jié)果更可能“超級(jí)棒”