展會信息港展會大全

專訪商湯田豐:行業(yè)已從感知智能進入生成式人工智能,未來期待具身智能
來源:互聯(lián)網(wǎng)   發(fā)布日期:2024-07-07 16:50:47   瀏覽:7265次  

導(dǎo)讀:本文來源:時代周報 作者:何珊珊 伴隨過去一年AI大模型的爆發(fā),生成式人工智能迎來了飛躍性的發(fā)展。 7月5日,在2024世界人工智能大會上,商湯科技(下稱商湯)董事長兼CEO徐立發(fā)布了日日新SenseNova 5.5大模型體系。他在會上還提出,當前人工智能正處于一個...

本文來源:時代周報 作者:何珊珊

伴隨過去一年AI大模型的爆發(fā),生成式人工智能迎來了飛躍性的發(fā)展。

7月5日,在2024世界人工智能大會上,商湯科技(下稱商湯)董事長兼CEO徐立發(fā)布了“日日新SenseNova 5.5”大模型體系。他在會上還提出,當前人工智能正處于一個關(guān)鍵的轉(zhuǎn)折節(jié)點,人工智能的超級時刻有賴于行業(yè)共同營造超級應(yīng)用。

中國人工智能產(chǎn)業(yè)正經(jīng)歷過哪些重要轉(zhuǎn)變?當前AI產(chǎn)業(yè)如何打造獨特競爭力?未來人類與科技如何共生?帶著這些問題,時代周報記者專訪商湯智能產(chǎn)業(yè)研究院院長田豐,與他共同探討。

專訪商湯田豐:行業(yè)已從感知智能進入生成式人工智能,未來期待具身智能

圖:商湯智能產(chǎn)業(yè)研究院院長田豐;圖源:受訪者供圖

十年躍遷:從感知智能到生成式人工智能

2024年,恰逢商湯成立的十周年,十年間商湯也伴隨行業(yè)一起成長。

田豐表示,當前行業(yè)已走過兩個階段。第一階段是感知智能時代,例如智慧城市、智能手機、自動駕駛汽車的激光雷達等技術(shù),都是通過攝像頭進行感知操作,是1.0階段的產(chǎn)業(yè)特點。第二段路是隨著2018年前后商湯研發(fā)AI大模型以及2023年ChatGPT帶來的生成式人工智能的爆發(fā),進入AI 2.0的時期。

當前2.0階段又分為上半場和下半場,上半場是知識工程,需要將各行業(yè)大量的高質(zhì)量數(shù)據(jù)喂養(yǎng)大模型,例如人文社科、醫(yī)療、法律、數(shù)學(xué)、物理等知識,讓通用大模型具備語義理解和用戶意圖識別等能力。下半場是具身智能驅(qū)動的工業(yè)革命,商湯及行業(yè)正處于第二階段的上半常

對于具身智能階段,田豐展現(xiàn)出期待。他認為,“具身智能將真正實現(xiàn)AI與物理世界的深度融合,使AI具備感知、記憶、決策、分析、認知和執(zhí)行的綜合能力并與機器人等執(zhí)行體進行融合。屆時,AI將不再僅僅是數(shù)字世界的數(shù)智生產(chǎn)力,而是能夠真實改造物理世界的強大新質(zhì)生產(chǎn)力。”

大模型如火如荼,圍繞背后的重要基礎(chǔ)設(shè)施算力,在過去一年的討論也從未停止。

算力對行業(yè)的影響,可參照英特爾公司創(chuàng)始人摩爾在1965年提出的“摩爾定律”,摩爾發(fā)現(xiàn),集成電路上可容納的晶體管數(shù)量每隔一段時間就會翻倍,同時價格也會減半。在現(xiàn)代社會,則體現(xiàn)在技術(shù)性能每隔一段時間顯著提高,而技術(shù)成本也隨之下降,能加速推動行業(yè)發(fā)展,進而對人類生活帶來巨大變化。而目前在尺度定律推動下,每一代大模型對AI算力的需求呈現(xiàn)超越摩爾定律的指數(shù)級增長趨勢。

2018年,商湯開始研究大模型,2019年商湯注意到算力的“巨大缺口”,于是在2020年7月和上海臨港集團,投入56億元,在上海自由貿(mào)易試驗區(qū)臨港新片區(qū)打造新一代人工智能計算與賦能平臺(商湯臨港AIDC),開發(fā)新型人工智能基礎(chǔ)設(shè)施SenseCore商湯大裝置。

最終,商湯成為最早布局AIDC人工智能智算中心的AI公司,也成為國內(nèi)第一個發(fā)布超過千億參數(shù)級大模型的公司。

據(jù)田豐介紹,SenseCore商湯大裝置管理的算力實現(xiàn)全國聯(lián)網(wǎng)的統(tǒng)一調(diào)度,在上海、深圳、廣州、福州、濟南、重慶等地都拓展了新的計算節(jié)點,總算力規(guī)模高達12000 petaFLOPS 。相當于可以同時支持訓(xùn)練20個1000億參數(shù)量的模型,具備龐大的算力和數(shù)據(jù)服務(wù)規(guī)模。

對于算力的重要性,田豐表示:“模型參數(shù)量、算力規(guī)模、訓(xùn)練數(shù)據(jù)規(guī)模的提升對于最終效果的影響并不是兩三倍的放大,而十倍百倍甚至千倍萬倍的的提升。如果算力能保持指數(shù)級的發(fā)展,未來3年到4年就有可能真正實現(xiàn)通用人工智能,從這個角度講,現(xiàn)在的算力仍處于起點,需要長周期中更大規(guī)模的擴張,才可能保證國產(chǎn)大模型始終領(lǐng)先在全球的前沿位置上。”

獨特優(yōu)勢:三位一體與端云結(jié)合

據(jù)田豐介紹,在上述的商湯臨港AIDC項目,當前已實現(xiàn)了全連接萬卡的AI超算集群,并行效率達95%,適配20多款國產(chǎn)GPU芯片。

但從行業(yè)來看,算力的需求永遠不會完全滿足。因此,要想擁有獨特優(yōu)勢,開發(fā)新型大模型能力應(yīng)用方式也成為關(guān)鍵,商湯的解法是端云一體融合的大模型架構(gòu)。

“例如,我要在手機上用AI助手查上海世博中心與周邊的吃喝玩樂方案,算力原本部署在云側(cè),比如只支持100萬用戶,但是我們把70%以上的算力移到到用戶的手機端處理需求,如果有處理不了的難題,再調(diào)動云側(cè)大模型,手機端的智能體和云側(cè)的大模型聯(lián)動,能更好的利用手機閑置算力。由于中國有海量的移動端用戶,這種方式可將支持的用戶量一下提升3倍以上。端側(cè)小模型加上云側(cè)大模型分工協(xié)同就是商湯日日新應(yīng)用的獨特優(yōu)勢。”田豐解釋道。

對于大模型的能力進階,田豐提出了三個核心層面的見解。首先,最為基礎(chǔ)的是知識能力,這是大模型認知世界的基石。其次,推理能力作為進階,要求大模型能夠進行深入、精準的邏輯分析。最終,執(zhí)行能力作為最高層次,要求大模型能夠?qū)⒗碚撝R轉(zhuǎn)化為實踐行動。

田豐比喻道,“在商湯從1.0到發(fā)布5.5版本的過程中,首要任務(wù)是讓大模型實現(xiàn)無所不知,從天文、地理、到歷史、物理等等,包羅萬象,使得大模型如同接受通識教育的大學(xué)生,快速形成對世界的全面認知與常識儲備。現(xiàn)階段則處于把大學(xué)生培養(yǎng)成研究生,要求大模型在精準研究、復(fù)雜推理方面具備能力,這也是大家當前提升的重點目標。最后則是向各行業(yè)專家和科學(xué)家看齊,達到人類頂尖的水平。”

同時田豐認為,如果要達到最后的頂尖階段,“數(shù)據(jù)是模型的生命線,高質(zhì)量的數(shù)據(jù)很關(guān)鍵。”

數(shù)據(jù)第一來源是各行業(yè)龍頭企業(yè)的高質(zhì)量數(shù)據(jù)集。例如打造法律大模型,需要把大量律師的經(jīng)驗和法律合同喂養(yǎng)給大模型訓(xùn)練,現(xiàn)在解決之道法律服務(wù)平臺的法律大模型能在一分鐘之內(nèi)生成一份定制化法律合同。第二部分是各領(lǐng)域頂尖專家的思維鏈數(shù)據(jù)。要想接近通用人工智能,需要學(xué)習(xí)各領(lǐng)域頂尖專家長鏈推理和思考過程,那么真正訓(xùn)練出來的大模型,會遠高于人類的平均水平。

田豐強調(diào),“真實世界的優(yōu)質(zhì)數(shù)據(jù)是有限且昂貴的,今年合成數(shù)據(jù)在訓(xùn)練中將超過真實數(shù)據(jù)。例如,大模型可以把1道數(shù)學(xué)題擴寫成5道題,也能夠生成高質(zhì)量的不同解題方法,通過舉一反三的能力產(chǎn)生更多合成數(shù)據(jù)。所以合成數(shù)據(jù)能力在未來是數(shù)據(jù)競爭非常重要的核心技術(shù)。”

田豐表示,“商湯跟其他人工智能公司最大的不同,在于底層AI算力基礎(chǔ)設(shè)施,數(shù)據(jù)管線工具、基礎(chǔ)大模型,三方面同時兼具,算力、數(shù)據(jù)、模型三位一體,形成具有自閉環(huán)創(chuàng)新價值的全棧自研模式。”

展望未來:

人機共智

與普惠向善

未來關(guān)于AI工具對于人類的作用,田豐認為,AI工具將經(jīng)歷“有中生有”到“無中生有”的兩條路徑。

第一種路徑是強化學(xué)習(xí),不斷學(xué)習(xí)人類頂尖專家經(jīng)驗,掌握人類最聰明的思考方式,創(chuàng)造更優(yōu)解法。第二種是自主推理,在一個規(guī)則體系之內(nèi),大模型通過算力和模擬環(huán)境快速實現(xiàn)遠超人類歷史發(fā)現(xiàn)的科學(xué)突破,達到“無中生有”的科學(xué)智能推理能力。

“例如找到新的數(shù)學(xué)的猜想和物理學(xué)的假設(shè)推理,我們稱之為‘機器猜想’。人腦的神經(jīng)元是100萬億,現(xiàn)在GPT-4是1.8萬億,當更大的模型達到百萬億之后,可能會涌現(xiàn)出這種更高級別的推理能力與機器猜想能力,也是我們爭取的目標。”田豐說道。

不久前,微軟計劃投資1000億美元打造全球最大的AI超算集群星際之門。大模型的成本固然高昂,但相比資金,更重要的是AI研發(fā)人才。

對于過去一年國內(nèi)外激烈的人才競爭,田豐表示:“通過我們的研究分析,中國其實是全球最大的AI人才培養(yǎng)國,想要留存人才,需要領(lǐng)軍科學(xué)家的號召和青年科學(xué)家的扶持。”

他認為,要想把 AI相關(guān)的天才人員留在中國沃土,團隊需要領(lǐng)軍科學(xué)家為首“靈魂人物”,同時應(yīng)當提供充分的信任、充足的預(yù)算,足夠的科研自由,讓青年AI科學(xué)家人才去做技術(shù)帶頭人、持續(xù)投入基礎(chǔ)科研突破,實現(xiàn)領(lǐng)軍科學(xué)家?guī)嗄昕茖W(xué)家,青年科學(xué)家再帶一群跨領(lǐng)域工程師的團隊架構(gòu)。只有人才密度、算力密度、數(shù)據(jù)密度很高的公司,未來才能夠具有躍遷的能力。

田豐透露,商湯因為堅持自主研發(fā)的原創(chuàng)能力,不斷吸引AI人才加入。自他2019年加入商湯至今,公司團隊人數(shù)已實現(xiàn)了2~3倍的增長,目前以徐立博士為核心,科研團隊穩(wěn)定地加速推進研發(fā)。

對于,心中未來的AI時代,田豐的憧憬是:“人機共智、開放共享,普惠向善。”

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責聲明 | 隱私條款 | 工作機會 | 展會港