AI時代架構創(chuàng)新不斷涌現(xiàn),而DeepSeek的出現(xiàn)為整個AI市場帶來了全新活力。近日,達摩院首席科學家、知合計算CEO孟建熠在2025玄鐵RISC-V生態(tài)大會上表示,DeepSeek在一定程度上改變了行業(yè)對AI硬件架構的訴求,模型持續(xù)創(chuàng)新是所有算力架構的機會。對RISC-V發(fā)展而言,打造標桿產品是關鍵。
DeepSeek讓大模型從云走向端孟建熠表示,DeepSeek問世之后,業(yè)界產生了三種不同觀點的爭論:一是開源架構與閉源架構誰更好。DeepSeek證明了開源架構也有很好的表現(xiàn)。二是該用Dense模型還是MoE模型。前者是通用全能的模型,后者是更好的專家模型,二者各有所長。三是算力敏感與內存容量敏感之爭。之前模型對算力的需求非常大,現(xiàn)在是容量很大,算力下降了,所以內存容量成為一項關鍵指標。“DeepSeek在一定程度上改變了大家對AI硬件架構的訴求。”孟建熠認為。模型深度優(yōu)化為算力架構帶來了全新可能。具體而言,一是MoE模型,以更低激活比達成更低的計算成本,并使模型的單機部署成為可能。二是稀疏計算與模型壓縮技術,識別并跳過模型中不重要的計算節(jié)點(如權重接近零的部分節(jié)點),同時結合模型壓信技術減少參數量。三是混合精度計算與量化技術,浮點計算轉化為低精度計算(如INT8、FP8、FP16),同時保持模型精度。四是動態(tài)計算圖優(yōu)代技術,實時調整計算結構減少冗余計算。五是內存優(yōu)化與數據流重構技術,減少內存訪問延遲以及數據傳輸開銷。六是分布式計算與負載均衡技術,將大規(guī)模模型推理任務拆分到多個計算節(jié)點,并通過負載均衡技術優(yōu)化任務分配。DeepSeek的出現(xiàn),推動行業(yè)更加關注底層硬件能力的適配!霸诤荛L一段時間里,大家都喜歡‘大炮打蚊子’,當然這樣是效率很高,但是今天我們有了一個新思路可以用軟硬件融合的視角來看待整個AI的發(fā)展!泵辖趶娬{,算力、內存、互聯(lián)之間原有的平衡發(fā)生了劇變,對于新的算力架構機會而言,大家再次進入同一起跑線。同時,開源大模型單機部署成為可能,進一步推動實際應用落地。另一個趨勢是大模型走向趨同,幫助算子收斂。值得關注的是,大模型的參數量和計算量巨大,但如今算子的個數在逐步收斂,主要以矩陣計算為中心,而且通過開源相互學習正在走向趨同。從云端協(xié)同的層面,DeepSeek幫助大模型從云走向端,由此也帶來了幾個變化:一是從算力瓶頸變?yōu)榇鎯Φ膸捄腿萘科款i,容量瓶頸成為全量大模型最關鍵的因素,比如671B大模型。二是降低計算資源需求,讓幾T、幾十T和幾百T的算力成為可能。三是實現(xiàn)單機部署的可能,能夠讓開源模型被更多私有數據優(yōu)化,形成私有解決方案。四是支持邊緣設備,使得高性能AI應用能夠在邊緣設備上順利運行。“大模型在云端的話,實施成本比較高,只有有限的企業(yè)可能在部分領域應用,而一旦到了端側,就有大量的應用都會發(fā)展起來!泵辖诒硎。模型創(chuàng)新是算力架構的機會當前算力基礎是以GPGPU(CUDA)為代表的傳統(tǒng)閉源硬件與生態(tài),而DeepSeek、Llama、Grok等開源大模型不斷涌現(xiàn),給算力架構帶來了新機會。當然,這個機會對所有架構都有效,并非只對RISC-V而言。如今,這些開源模型正在吸引更多算力架構,包括x86、Arm這樣的傳統(tǒng)CPU架構,DSA、ASIC這樣的自研架構,以及以RISC-V為代表的開源架構。“我們都在一個新的起點上,現(xiàn)在就看誰能夠跑得快!泵辖谡f道。作為三大主流指令集架構中最靈活、最開放的一個,RISC-V適應了AI時代的技術創(chuàng)新節(jié)奏。它在原生AI支持上,擁有開源與開放架構、更易實現(xiàn)的軟硬件協(xié)同設計、更優(yōu)的能效比,以及覆蓋全球、不斷成熟的生態(tài)。在孟建熠看來,“RISC-V架構+AI”是以AI原生成為架構創(chuàng)新的最終答案。隨著開源RISG-V架構的快速發(fā)展,重新自研架構已意義不大,以RISC-V為基礎構建處理芯片是未來的主流。RISC-V在AI領域具備很高的包容性,可以支持做CPU/DSA,也支持做GPU、多核產品或者近內存計算!按蠹铱梢栽谟布喜粩鄤(chuàng)新,而生態(tài)上統(tǒng)一在RISC-V。盡管目前有不同的實踐方案,但最終一定會走向生態(tài)統(tǒng)一!泵辖诒硎尽ISC-V如何真正走出來,是備受業(yè)界關注的一個問題。發(fā)展至今,RISC-V生態(tài)已經慢慢建立起來,從IoT等功耗敏感型場景向服務器等高算力場景成長,從純通用計算向AI計算與通用計算融合成長,其中已經有了一些標桿性產品。打造標桿產品是RISC-V成長路徑的關鍵環(huán)節(jié)。孟建熠指出,RISC-V發(fā)展中的一個新趨勢是從“小標桿產品”向“大標桿產品”成長,引領軟件生態(tài)加速配適,吸引產業(yè)資源加大傾斜。實際上,國內外企業(yè)都在嘗試打造RISC-V的標桿產品。比如,國內的達摩院2022年發(fā)布了基于玄鐵C910 RISC-V核的4核產品,推動了包括安卓在內的軟件廠商加入RISC-V生態(tài)。國際上,Tenstorrent、Vantana和SiFive等企業(yè)也推出一些標桿產品。其中,Tenstorrent最新的RISC-V核“Ascalon”采用了CPU中少見的8-Wide指令集解碼器設計。孟建熠認為,下一代RISC-V標桿產品在服務器場景、AI PC場景、AI場景有著一些關鍵指標。要真正從產業(yè)中走出來,性價比很重要!皹藴式ㄔO是RISC-V下階段發(fā)展的重中之重!泵辖诒硎荆瑖鴥犬a業(yè)需要在標準建設中盡快形成合力。目前,國際上在指令架構上的貢獻明顯高于國內,國內力量的參與度還不夠。國內已經建立多個組織,都在進行相關的指令集的制定工作,需要聯(lián)合起來統(tǒng)一到一個平臺工作。另外,技術路線上要考慮相對集中,以AI為目標先做一輪國內標準制定的嘗試。此外,計算原語是相似的,所以CPU、GPGPU、TPU在擴展上要形成一定的梯度,不能把指令集做成很多套并行大而全的擴展,這樣生態(tài)就無法形成。延伸閱讀:新型儲能制造業(yè)全面邁向高質量發(fā)展今年全國兩會,代表委員對《中國電子報》記者說……作者丨楊鵬岳編輯丨張心怡美編丨馬利亞監(jiān)制丨連曉東