中國的人工智能產(chǎn)業(yè)正從拼參數(shù)轉(zhuǎn)向拼應(yīng)用。
作者|王藝
2024年已接近尾聲,但人工智能的熱度仍未消減。
這一年,Sora的發(fā)布引發(fā)全球震驚,GPT-4o的多模態(tài)能力和OpenAI o1的推理能力震驚世界;英偉達GTC上發(fā)布了Blackwell架構(gòu)的GPU,使用更低成本構(gòu)建更高量級的算力基礎(chǔ)設(shè)施成為可能;AI for Science的發(fā)展如火如荼,諾貝爾物理和化學(xué)獎都頒發(fā)給了人工智能相關(guān)的科學(xué)家,AlphaFold3的發(fā)布讓人工智能預(yù)測生命分子間的相互作用能力更進一步;AI應(yīng)用遍地開花,從以Character.ai為代表的AI情感陪伴,到以Perplexity為代表的AI搜索,再到以Cursor為代表的AI編程,這些應(yīng)用不僅展現(xiàn)了AI技術(shù)的無限潛力,也預(yù)示著一個由AI賦能的美好未來正在加速到來。
這一年,中國的人工智能領(lǐng)域也有不少大事發(fā)生:文心大模型的日均調(diào)用量超15億次,通義Qwen2.5-72B的性能超越Llama 405B,再登全球開源大模型王座;智譜GLM-4的整體性能逼近GPT-4,面壁智能端側(cè)模型MiniCPM3.0能力超GPT-3.5;文生視頻方面,生數(shù)Vidu、快手可靈、字節(jié)即夢、智譜清影等神仙打架,智源研究院Emu-3開辟原生多模態(tài)大模型新道路;具身智能領(lǐng)域,銀河通用、星動紀元、星海圖等企業(yè)屢獲大額融資。產(chǎn)業(yè)端,大模型助力了金融、醫(yī)療、教育、智能制造等行業(yè)的提質(zhì)增效;消費側(cè),豆包、Kimi、星野等應(yīng)用在國內(nèi)爆火,Talkie、Gauth等則在海外大殺四方。
可以說,人工智能已經(jīng)成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,不僅在科研探索、技術(shù)創(chuàng)新方面引領(lǐng)潮流,更在實際應(yīng)用中展現(xiàn)出巨大的經(jīng)濟和社會價值。
12月14日,以“創(chuàng)新驅(qū)動,智啟新程”為主題的中國人工智能大會(CCAI)開幕式在中關(guān)村國家自主創(chuàng)新示范區(qū)展示中心召開。本屆大會由中國人工智能學(xué)會主辦,北京市科學(xué)技術(shù)委員會、中關(guān)村科技園區(qū)管理委員會,北京市海淀區(qū)人民政府支持。大會圍繞具身智能、端側(cè)模型、科學(xué)智能、世界模型和空間智能等熱點話題舉辦7個主旨演講、1場尖峰對話,18場專題論壇,聚焦國內(nèi)外人工智能領(lǐng)域十余名中外院士、百余位產(chǎn)學(xué)研專家現(xiàn)場分享從技術(shù)研究到產(chǎn)業(yè)創(chuàng)新的思路和方法。開幕式上發(fā)布《北京人工智能產(chǎn)業(yè)白皮書(2024)》、《2024年度中關(guān)村科學(xué)城人工智能全景賦能典型案例》、超節(jié)點算力集群創(chuàng)新聯(lián)合體等重磅成果。
一場人工智能的盛典,正在海淀徐徐拉開序幕。
1.中國人工智能正從拼參數(shù)轉(zhuǎn)向拼應(yīng)用
ChatGPT推出已有兩周年,中國的大模型發(fā)展到今天,也經(jīng)歷了一個從烈火烹油到回歸理性的過程。
近年來,百模大戰(zhàn)轟轟烈烈,從語言大模型,到文生視頻大模型,再到3D生成大模型,大廠和創(chuàng)業(yè)公司們你方唱罷我登場,幾乎每隔幾個月就會有讓人眼前一亮的大模型出現(xiàn)。
大模型能力提升的背后,是各個廠商瘋狂的燒錢競賽。Scaling Law主導(dǎo)下的大模型預(yù)訓(xùn)練需要消耗大量的算力和數(shù)據(jù),訓(xùn)練一次模型動輒就要花幾千萬甚至上億美元,比如GPT-4的訓(xùn)練花了約7800萬美元,而Gemini Ultra的訓(xùn)練花了約1.91億美元。隨著中國大模型廠商的估值陸續(xù)跨上200億美元的臺階,國內(nèi)大模型公司的單次融資規(guī)模上升到了50億元,想要做出更好的模型效果,就需要融更多的資、燒更多的錢。
海量的燒錢之下,盈利卻遙遙無期。以O(shè)penAI為例,其2024年的營收預(yù)計在35億-45億美元之間,但是運營成本卻為85億美元,一年的虧損將近50億美元;紅杉資本報告測算認為,AI企業(yè)只有將年營收總和增至6000億美元,才能支付AI基礎(chǔ)設(shè)施建設(shè)所需要的龐大資金。
也由此,為了獲取更多的用戶和收入,各大模型廠商不得不打起了打價格戰(zhàn)5月6日,DeepSeek將其DeepSeek-V2模型的token定價為輸入1元/百萬tokens(0.001 元/千tokens)、2 元/百萬tokens(0.002元/千tokens),價格僅為GPT-4-Turbo的近1%;隨后,字節(jié)將豆包大模型定價為0.0008元/千tokens,阿里將Qwen-Long降價為0.0005元/千tokens,百度和騰訊更是直接宣布模型免費。
但是價格戰(zhàn)不可持續(xù)。大模型發(fā)展到今天,靠繼續(xù)提升通用大模型性能帶來的行業(yè)進步已經(jīng)十分有限,要想繼續(xù)摘到產(chǎn)業(yè)果實,就必須扎根產(chǎn)業(yè)場景,這就需要大模型的落地應(yīng)用。
在大會開幕式上,中國科學(xué)院院士、琶洲實驗室(黃埔)主任、西安交通大學(xué)西安數(shù)學(xué)與數(shù)學(xué)技術(shù)研究院院長、大數(shù)據(jù)算法與分析技術(shù)國家工程實驗室主任、CAAI Fellow徐宗本院士做了題為《大模型的極限理論:解讀智能涌現(xiàn)現(xiàn)象》的報告,在報告中他提到,如果一個問題的本質(zhì)數(shù)據(jù)是涌現(xiàn)的,那么大模型一定可以解決該問題;假如一個數(shù)學(xué)領(lǐng)域的問題,限定在一個特定的公理體系之下,且這個問題的數(shù)據(jù)量是涌現(xiàn)的,那么這就是一個線性問題,大模型可以解決該問題。
CAAI副理事長、中國工程院院士、CAAI/CIE/CAA/CIC/CSF/IET Fellow何友院士作了題為《AI大模型與智能決策》的報告,在報告中,他列舉了大模型在自動駕駛、元宇宙、醫(yī)療、氣象、物流、軍事等領(lǐng)域的應(yīng)用,為大模型與具體行業(yè)的結(jié)合指明了方向。
然而,當(dāng)下中國的大模型在落地過程中仍然有很多難點:明確有商業(yè)價值的落地場景有限,模型落地的工程化能力不足、行業(yè)和場景大模型尚不完善、企業(yè)自身對大模型的認知不足等。此外,能否找到愿意為模型能力買單的市場和用戶、以及具體交付的能力,也是大模型能否成功落地的重要因素。
這時候,政府的助推,和案例的引領(lǐng)示范作用就很重要。
海淀區(qū)就在做這樣的事。在中國人工智能大會開幕式上,海淀區(qū)發(fā)布了《2024年度中關(guān)村科學(xué)城人工智能全景賦能典型案例》,包括華清未央、生數(shù)科技、深勢科技等在內(nèi)的20余家企業(yè)入選了案例集。海淀區(qū)希望以這樣的方式牽引各行業(yè)用戶聚焦人工智能應(yīng)用,以更加開放、包容的心態(tài)擁抱人工智能時代的技術(shù)革新和產(chǎn)業(yè)蝶變。
“我們將持續(xù)推動人工智能產(chǎn)業(yè)化發(fā)展,落實全景賦能行動計劃,打造國家級AI+教育、AI+法律、AI+文化示范應(yīng)用場景。集聚具身智能、醫(yī)藥健康等領(lǐng)域,推動人工智能與重點產(chǎn)業(yè)深度融合,規(guī);l(fā)展,加快轉(zhuǎn)化為現(xiàn)實生產(chǎn)力!痹诖髸,海淀區(qū)委書記、中關(guān)村科學(xué)城黨工委書記張革表示。
在開幕式的尖峰對話環(huán)節(jié),中國科學(xué)院外籍院士、美國國家科學(xué)院院士、清華大學(xué)講席教授丘成桐,國務(wù)院參事、中國工程院院士、清華大學(xué)信息科學(xué)技術(shù)學(xué)院院長戴瓊海,京東集團副總裁、京東探索研究院院長、何曉冬,臺灣陽明交通大學(xué)終身講座教授、南京應(yīng)用數(shù)學(xué)中心副主任林文偉與北京雁棲湖應(yīng)用數(shù)學(xué)研究院副院長、研究員鄔榮領(lǐng)五位嘉賓一起討論了AI for Science、AI For Math和Math for AI的問題。
丘成桐表示,現(xiàn)在人工智能發(fā)展的主要問題是缺乏理論支撐,做人工智能研究需要找到基本的公理;戴瓊海和何曉東也提到,如何用數(shù)學(xué)的方法表達人工智能、給人工智能更好的解釋和發(fā)展,進而在產(chǎn)業(yè)界中發(fā)現(xiàn)更多的規(guī)律,是人工智能下一步發(fā)展的關(guān)鍵,也是在科研應(yīng)用中實現(xiàn)從0到1突破的核心。
尖峰對話現(xiàn)場,圖源:2024中國人工智能大會
2.全景賦能更進一步
作為高校和科研機構(gòu)最密集的地方和全國科技創(chuàng)新中心核心區(qū),海淀區(qū)一直以來就非常重視人工智能產(chǎn)業(yè)的發(fā)展。
2018年11月,北京市科學(xué)技術(shù)委員會發(fā)布了北京智源行動計劃,和海淀區(qū)政府共同推動成立了北京智源人工智能研究院;2019年5月,海淀區(qū)發(fā)布了《關(guān)于加快中關(guān)村科學(xué)城人工智能創(chuàng)新引領(lǐng)發(fā)展的十五條措施》,旨在強化原始創(chuàng)新能力提升,集中支持關(guān)鍵技術(shù)源頭創(chuàng)新,鼓勵發(fā)展早期和長期投資;
2023年6月,海淀區(qū)政府印發(fā)《關(guān)于加快中關(guān)村科學(xué)城人工智能大模型創(chuàng)新發(fā)展的若干措施》通知,在大模型軟硬件技術(shù)體系、公共算力、數(shù)據(jù)要素供給、人才引育與國際合作、產(chǎn)業(yè)重塑等五個方面給予了支持;2023年9月,海淀區(qū)發(fā)布了《中關(guān)村科學(xué)城通用人工智能創(chuàng)新引領(lǐng)發(fā)展實施方案(20232025年)》,指出要加強人工智能原始創(chuàng)新和前沿研究、推動人工智能大模型創(chuàng)新體系發(fā)展、構(gòu)建通用人工智能活躍創(chuàng)新生態(tài)。
隨著大模型技術(shù)逐漸成熟、開始尋找落地場景,海淀更是在人工智能領(lǐng)域?qū)页鲂抡,以加大政策扶持力度、?yōu)化創(chuàng)新生態(tài)環(huán)境、強化產(chǎn)學(xué)研用深度融合的方式,不遺余力地推動人工智能的產(chǎn)業(yè)化發(fā)展:
今年4月,在2024中關(guān)村論壇年會上,海淀區(qū)發(fā)布“人工智能創(chuàng)新街區(qū)”概念,該街區(qū)位于海淀南部具有優(yōu)越的人工智能資源、國際互動最緊密的53平方公里范圍內(nèi),將全面搭建通用城市智能底座,并率先在五道口和大鐘寺建設(shè)兩個先導(dǎo)區(qū);6月,海淀區(qū)上線了北京人工智能數(shù)據(jù)運營平臺,該平臺在實現(xiàn)數(shù)據(jù)的匯聚管理、處理與加工等功能基礎(chǔ)上,能夠提供多種模態(tài)的數(shù)據(jù)標(biāo)注功能,目前已經(jīng)匯聚超過700萬億字節(jié)的通用數(shù)據(jù)集和4.33萬億字節(jié)的行業(yè)數(shù)據(jù)集;今年8月,在原有中關(guān)村科學(xué)城科技成長基金的基礎(chǔ)上,海淀區(qū)推出了中關(guān)村科學(xué)城科技成長二期基金,二期基金由40億元的母基金和10億元的直投基金組成,其推出后,中關(guān)村科學(xué)城科技成長基金規(guī)模已經(jīng)擴容至100億元,主要投資人工智能產(chǎn)業(yè),科技服務(wù)業(yè),醫(yī)藥健康、集成電路、商業(yè)航天等戰(zhàn)略性新興產(chǎn)業(yè),以及具身智能、量子、6G等未來產(chǎn)業(yè)。
同樣是在今年8月,海淀區(qū)發(fā)布《中關(guān)村科學(xué)城人工智能全景賦能行動計劃(2024-2026年)》(簡稱“行動計劃”),提出了三年內(nèi)“涌現(xiàn)100個示范引領(lǐng)典型案例”的發(fā)展目標(biāo)。面向社會廣泛征集人工智能創(chuàng)新應(yīng)用,儲備一批AI應(yīng)用案例,覆蓋具身智能、智能駕駛、醫(yī)藥健康、智能制造、工業(yè)設(shè)計、科學(xué)研究、教育教學(xué)、政務(wù)服務(wù)等多個領(lǐng)域。
經(jīng)過近四個月的多輪評選,20個人工智能應(yīng)用案例入選2024年度中關(guān)村科學(xué)城人工智能全景賦能典型案例(排名不分先后):
其中,深勢科技的“人工智能驅(qū)動的科學(xué)研究創(chuàng)新示范平臺”用人工智能學(xué)習(xí)微觀粒子如電子、原子、分子的運動規(guī)律,打造了微觀尺度的科學(xué)研究和工業(yè)研發(fā)基礎(chǔ)設(shè)施,如Bohrium科研云平臺、Hermite藥物計算設(shè)計平臺、RiDYMO中成藥靶標(biāo)研發(fā)平臺及Piloteye電池設(shè)計自動化平臺等,賦能了醫(yī)藥、材料、新能源等多個領(lǐng)域公司的發(fā)展;
銀河通用則通過合成數(shù)據(jù)的訓(xùn)練讓其具身大模型機器人Galbot(G1)擁有了全球領(lǐng)先的泛化物體抓取技術(shù),目前已經(jīng)實現(xiàn)了抓取隨機放置的透明、高光等物體,在工業(yè)場景下,Galbot可實現(xiàn)搬運箱體、分揀物品、裝載等工作;在零售場景中,Galbot主要承擔(dān)商品取補貨、盤點搬運、門店監(jiān)控等工作。目前,銀河通用已經(jīng)與奔馳、極氪、美團等企業(yè)開展了廣泛的場景落地合作,主要聚焦于商業(yè)24小時無人場景和工廠、車廠的落地驗證上。
據(jù)悉,人工智能全景賦能典型案例的發(fā)布,是海淀區(qū)落實《行動計劃》、打造人工智能全景賦能“第一城”的重要舉措。下一步,海淀區(qū)表示將繼續(xù)發(fā)揮人工智能產(chǎn)業(yè)集聚優(yōu)勢,依托人工智能創(chuàng)新街區(qū)和創(chuàng)新應(yīng)用加速器“格物社區(qū)”,推動人工智能科技場景落地實踐,共創(chuàng)更廣領(lǐng)域、更大范圍、更遠邊界的人工智能全場景應(yīng)用。
3.產(chǎn)業(yè)出題,政府搭臺,企業(yè)答題
除了《人工智能全景賦能典型案例》,在大會上同步發(fā)布的,還有《北京人工智能產(chǎn)業(yè)白皮書(2024)》(以下簡稱“白皮書”)。
北京市科委中關(guān)村管委會信息科技處處長韓健發(fā)布白皮書 圖源:北京市科學(xué)技術(shù)委員會
《白皮書》是在市委、市政府的統(tǒng)籌部署下,由北京市科委、中關(guān)村管委會作為牽頭部門,為進一步凝聚行業(yè)共識,促進產(chǎn)業(yè)發(fā)展,組織學(xué)術(shù)和產(chǎn)業(yè)界專家共同編制的,它展示了北京在人工智能產(chǎn)業(yè)發(fā)展上的強勁勢頭和亮眼成績:
2024年北京人工智能核心產(chǎn)業(yè)規(guī)模將突破3000億元,同比增長超12%,提前一年完成北京市人工智能創(chuàng)新策源地三年實施方案目標(biāo);人工智能企業(yè)超2400家,同比增長超9%;上市企業(yè)46家,總市值約4.3萬億元;獨角獸企業(yè)36家,占全國超半數(shù)。
同時,《白皮書》還詳細介紹了過去一年,市區(qū)兩級相關(guān)部門在人工智能領(lǐng)域軟硬件技術(shù)創(chuàng)新、基礎(chǔ)設(shè)施建設(shè)、數(shù)據(jù)要素供給、行業(yè)場景應(yīng)用、生態(tài)環(huán)境構(gòu)建等方面的工作舉措:
比如,在技術(shù)創(chuàng)新方面,北京在通用大模型等主流技術(shù)路線上持續(xù)布局,部分成果可對標(biāo)國際水平;在應(yīng)用落地方面,北京舉辦了大模型應(yīng)用大賽,推動行業(yè)龍頭企業(yè)與優(yōu)勢技術(shù)企業(yè)共建聯(lián)合研發(fā)平臺;在資源配置方面,北京持續(xù)推進算力基礎(chǔ)設(shè)施建設(shè),全市多個E級智算中心正在加快建設(shè);加速高質(zhì)量數(shù)據(jù)匯聚互通,智源研究院所建設(shè)的北京人工智能數(shù)據(jù)運營平臺,已匯聚了180多個數(shù)據(jù)集、近2000TB的數(shù)據(jù)總量。
而在其中,海淀區(qū)的表現(xiàn)尤為突出:依托教育、科技、人才資源高度密集和四區(qū)政策疊加的獨特優(yōu)勢,海淀區(qū)落地了清華大學(xué)人工智能學(xué)院和5個國家人工智能產(chǎn)教融合創(chuàng)新平臺;與北大、清華七所高校簽訂共建人工智能產(chǎn)業(yè)高地的合作協(xié)議。匯聚數(shù)據(jù)集超過1PB,揭牌了北京數(shù)據(jù)基礎(chǔ)制度先行區(qū)。
算力是人工智能產(chǎn)業(yè)發(fā)展的重要基礎(chǔ)設(shè)施。作為大會的一項重要成果,超節(jié)點算力集群創(chuàng)新聯(lián)合體正式發(fā)布。超節(jié)點算力集群顛覆了傳統(tǒng)單機八卡服務(wù)器的新型算力組網(wǎng)形態(tài),伴隨大模型向萬億參數(shù)演進,模型性能和泛化能力進一步增強,進一步推動底層智算基礎(chǔ)設(shè)施向“超節(jié)點”形態(tài)升級。北京市科委、中關(guān)村管委會聯(lián)合浪潮集團、阿里云,清華大學(xué)、中國科學(xué)院計算所、中國科學(xué)院微電子所,以及中國移動暨智算芯片OISA高速互聯(lián)推委會、高通量以太網(wǎng)聯(lián)盟等參與單位,共同為超節(jié)點算力集群創(chuàng)新聯(lián)合體揭牌。
超節(jié)點算力集群創(chuàng)新聯(lián)合體揭牌儀式,圖源:北京市科學(xué)技術(shù)委員會
而在算力領(lǐng)域,海淀同樣在積極布局:不僅針對技術(shù)創(chuàng)新強,應(yīng)用生態(tài)豐富的大模型發(fā)布了接近2億元的算力補貼政策,還承接和推動北京人工智能公共算力平臺建設(shè)、與內(nèi)蒙古、河北、新疆等多地強化跨區(qū)域算力協(xié)同,整合匯集算力供給重點企業(yè);同時,海淀也在布局建設(shè)國產(chǎn)芯片評測驗證迭代實驗環(huán)境,加快實現(xiàn)高水平國產(chǎn)替代。
2024年10月,中關(guān)村視聽產(chǎn)業(yè)技術(shù)創(chuàng)新聯(lián)盟(新一代人工智能產(chǎn)業(yè)技術(shù)創(chuàng)新戰(zhàn)略聯(lián)盟)還發(fā)布了反映全國算力中心發(fā)展程度和未來趨勢的算力節(jié)點成熟度評測體系,計劃推動全國一體化算力監(jiān)控與調(diào)度,為算力網(wǎng)的建設(shè)提供標(biāo)準(zhǔn)化的評測和指導(dǎo)。
從設(shè)立20億元的人工智能科學(xué)家創(chuàng)業(yè)基金和10億元的人工智能產(chǎn)業(yè)引導(dǎo)基金,到建設(shè)公共算力平臺,到規(guī)劃人工智能創(chuàng)新街區(qū),再到推出《人工智能全景賦能行動計劃》并發(fā)布《人工智能全景賦能典型案例》,海淀一直在用實際行動支持人工智能產(chǎn)業(yè)的發(fā)展。也正是得益于海淀在產(chǎn)業(yè)政策、關(guān)鍵要素供給、空間、資本、人才等方面對人工智能產(chǎn)業(yè)的全方位支持,海淀區(qū)現(xiàn)有人工智能產(chǎn)業(yè)鏈上和下游企業(yè)約1300家,占了北京市人工智能產(chǎn)業(yè)的60%;其中,人工智能獨角獸企業(yè)26家,備案大模型66款,占全國三成;國家科學(xué)技術(shù)獎5個人工智能獎項均在海淀,海淀區(qū)人工智能集群也在2024年獲批全國首個先進制造產(chǎn)業(yè)集群。
而未來,人工智能產(chǎn)業(yè)在海淀,還有更多的精彩值得期待。
(封面圖來源:2024中國人工智能大會)