展會信息港展會大全

中外大模型加速開源+免費!文心一言降本大揭秘,GPT-5緊追
來源:互聯(lián)網(wǎng)   發(fā)布日期:2025-02-16 22:11:14   瀏覽:347次  

導(dǎo)讀:智東西(公眾號:zhidxcom)作者 | 徐豫編輯 | 漠影DeepSeek后時代,“開源”和“免費”,力壓“參數(shù)量”和“模型架構(gòu)”之爭,成為大模型圈新的風(fēng)暴中心。智東西2月15日報道,不到一個月內(nèi),百度、DeepSeek、OpenAI、谷歌、xAI等主流大模型廠商們密集官宣,旗下閉源高端AI模型將轉(zhuǎn)向開源,而主流AI產(chǎn)品計劃免費向用戶開放。這不僅是大模型競賽進入新一輪白熱化階段的信號,也是 ......

智東西(公眾號:zhidxcom)

作者 | 徐豫

編輯 | 漠影

DeepSeek后時代,“開源”和“免費”,力壓“參數(shù)量”和“模型架構(gòu)”之爭,成為大模型圈新的風(fēng)暴中心。

智東西2月15日報道,不到一個月內(nèi),百度、DeepSeek、OpenAI、谷歌、xAI等主流大模型廠商們密集官宣,旗下閉源高端AI模型將轉(zhuǎn)向開源,而主流AI產(chǎn)品計劃免費向用戶開放。這不僅是大模型競賽進入新一輪白熱化階段的信號,也是AI技術(shù)走近尋常百姓家的關(guān)鍵節(jié)點。

百度和OpenAI兩家更是戰(zhàn)況焦灼,前后腳劇透下一代新模型、深度搜索功能、生成式AI工具免費可用,以及開源計劃。

2月14日,百度宣布將在接下來的幾個月內(nèi),陸續(xù)推出文心大模型4.5系列,并且新一代文心大模型將自6月30日起開源。這也是百度旗下大模型首次開源。與此同時,有市場消息稱,百度今年還會發(fā)布文心大模型的5.0系列。

再往前一天,百度官宣,自4月1日起,文心一言將全面免費,用戶可以通過PC端和APP端,免費使用最新款的文心系列模型。同日,OpenAI CEO奧爾特曼在X上發(fā)布長文,官宣計劃在幾周,或者幾個月內(nèi),發(fā)布新一代模型GPT-4.5(內(nèi)部代號“Orion”)和GPT-5系統(tǒng)。

奧爾特曼還在文中寫道,其ChatGPT的免費套餐,也將包括對GPT-5的無限制聊天訪問權(quán)限。換句話說,用戶不僅可以免費使用ChatGPT的搜索功能,后續(xù)還可以免費用上OpenAI最先進的模型。

本月早些時候,谷歌也宣布了將開放其最新的Gemini 2.0系列模型。馬斯克則2月14日接受采訪時談道,計劃將在一到兩周內(nèi)推出新一代AI模型Grok 3,性能或?qū)⒊紾PT系列,并且很大概率延續(xù)開源策略。可以說,上述幾家大模型廠商都卯足了勁,準(zhǔn)備在這個節(jié)骨眼大干一場,誰也沒有打算讓著誰。

另外,百度和OpenAI均計劃逐步開放深度檢索相關(guān)功能。

OpenAI方面稱,深度研究功能起初會提供每月2次的免費使用機會、每月10次的Plus用戶使用機會,而所有Pro用戶均可在移動端和桌面端APP上使用該功能。百度文心一言的深度搜索功能現(xiàn)已上線PC端,從4月1日起即可免費使用,APP端也即將上線。

時至今日,大模型能夠走向免費、開源、開放,背后離不開技術(shù)突破所帶來的訓(xùn)練和推理成本下降。

2月11日,百度創(chuàng)始人李彥宏在阿聯(lián)酋迪拜出席“世界政府峰會”上時分享道,“在過去,當(dāng)我們談?wù)撃柖蓵r,每18個月,性能水平或價格都會減半。但今天,當(dāng)我們談?wù)摯笮驼Z言模型時,可以說每12個月推理成本就降低90%以上。”

OpenAI CEO奧爾特曼近日也在博客上表達了類似觀點。據(jù)他觀察,AI價格的下降顯著刺激了AI使用量的增長。奧爾特曼稱,AI使用成本正大幅下降,每年比前一年便宜約9成,這也有助于AI普及更多用戶。

用大模型這件事兒越來越便宜,不僅讓各中小型企業(yè)本地化部署大模型的價格門檻更低,還能開發(fā)出更適用的大模型衍生品;也有助于普羅大眾把用AI產(chǎn)品變得日;,動手搭建個性化的AI工具、AI產(chǎn)品、AI智能體,最終共同為整個AI生態(tài)持續(xù)注入活力。

那么,大模型憑什么敢免費開放,究竟如何提供高性價比的AI算力,先進模型能力到底強在哪?通過拆解百度多項大模型開發(fā)經(jīng)驗,我們找到了自研芯片、數(shù)據(jù)中心和AI計算平臺,以及推理技術(shù)架構(gòu)深度優(yōu)化這4大答案。

一、文心系列打頭陣,深度搜索功能即將全量上線

時隔大半年,百度文心大模型即將連續(xù)刷級。據(jù)百度方面最新消息,文心大模型4.5系列將在未來幾個月內(nèi)陸續(xù)推出。另據(jù)近期市場消息,文心大模型5.0系列也將在年內(nèi)發(fā)布,時間可能是今年下半年。

2023年10月,百度發(fā)布了文心大模型4.0;去年4月,文心大模型4.0工具版上線;去年6月,4.0系列中性能較強的文心大模型4.0 Turbo正式推向市場。結(jié)合4.0系列的發(fā)布節(jié)奏來看,或許百度已用實際行動印證了李彥宏所說的“創(chuàng)新的本質(zhì)”。在他看來,創(chuàng)新的本質(zhì)基本遵循“如果你能將成本降低一定數(shù)量、一定百分比,那么這意味著你的生產(chǎn)率提高了相同的百分比”。

有知情人士劇透,文心大模型4.5和5.0,將在多模態(tài)能力上有明顯提升。OpenAI則選擇將o3推理模型等多種AI技術(shù)和能力,集成到即將發(fā)布的GPT-5 AI系統(tǒng)中。

同時,文心大模型的視覺智能能力也是其一大特色;诖耍俣然?qū)⒋鍻penAI和谷歌,接管國行版iPhone中Apple Intelligence的視覺智能。據(jù)外媒2月14日報道,百度將負(fù)責(zé)承擔(dān)“國行版”Apple Intelligence所提供的圖像識別、檢索等功能。

目前,百度自研的iRAG(image-based Retrieval-Augmented Generation,基于圖像的檢索增強生成技術(shù))結(jié)合了檢索增強(RAG)技術(shù)和視覺智能,可以檢索、比對、參考百度搜索引擎的大量圖片資源,然后通過文本生成質(zhì)量更高、元素更逼真的AI圖像,減少傳統(tǒng)文生圖技術(shù)易出現(xiàn)的“幻覺”現(xiàn)象。

實測表明,具備iRAG能力的文心大模型4.0,所生成的人物形象及其動作都更加貼合文字描述和物理邏輯。此外,文心大模型4.0支持一次生成多張AI圖像。

中外大模型加速開源+免費!文心一言降本大揭秘,GPT-5緊追

▲左圖由文心大模型4.0生成,右圖由文心大模型3.5生成(圖源:百度)

而單從檢索增強方面來看,百度的生成式AI工具文心一言,比OpenAI的AI聊天助手ChatGPT,在聯(lián)網(wǎng)檢索準(zhǔn)確性、內(nèi)容描述的細(xì)致程度上,都更勝一籌。

先拋給它們一個有唯一解的問題:“2025年中國的法定假日有哪些?”

中外大模型加速開源+免費!文心一言降本大揭秘,GPT-5緊追

文心一言發(fā)現(xiàn)了今年是中秋節(jié)與國慶節(jié)連休,但ChatGPT弄錯了中秋節(jié)的日期,并且沒有發(fā)現(xiàn)連休假期的特殊情況。

中外大模型加速開源+免費!文心一言降本大揭秘,GPT-5緊追

再拋給它們一個開放式的問題:“哪吒2中,在做藕粉的過程中,出現(xiàn)了哪些讓哪吒感覺不適的操作?”

中外大模型加速開源+免費!文心一言降本大揭秘,GPT-5緊追

ChatGPT聯(lián)網(wǎng)檢索后生成的答案有偏離影片事實的部分,文心一言則更加準(zhǔn)確地描述出了影片細(xì)節(jié)內(nèi)容。

中外大模型加速開源+免費!文心一言降本大揭秘,GPT-5緊追

今年內(nèi),文心一言還有望勝任一些更專業(yè)化、行業(yè)門檻更高的內(nèi)容。2月13日,百度官宣文心一言網(wǎng)頁版上線了深度搜索功能,App端也即將同步升級。

基于該深度搜索功能,文心一言可以應(yīng)對民生、創(chuàng)業(yè)、經(jīng)濟分析類等專業(yè)咨詢類的問題,內(nèi)容回復(fù)預(yù)期達到專家級水平,在一定程度上突破了過去查詢渠道較為小眾、專業(yè)領(lǐng)域解析難度大等AI搜索瓶頸。

除了增強搜索能力,百度方面透露文心一言的思考、規(guī)劃和反思能力都進一步提升,從而能夠更“聰明”地使用多種工具解決復(fù)雜任務(wù)。

例如,遇到一些不能簡單處理的問題,文心一言可以先“閱讀”、“理解”用戶上傳的文檔,再搜索、分析相關(guān)內(nèi)容,最后綜合考慮私域資源和公域資源信息,得出結(jié)果。

二、“芯”動力撐腰,大幅提升模型訓(xùn)練效率

當(dāng)前,大模型及其產(chǎn)品性能增強的同時,還要控制、降低開發(fā)和使用成本,以實現(xiàn)向用戶開源并免費開放。這背后離不開整體算力架構(gòu)的提效優(yōu)化。

首先是算力“油門”,即芯片。

百度自研的AI芯片“昆侖芯”,專注于大模型訓(xùn)練和推理優(yōu)化,驅(qū)動一系列文心大模型縮短訓(xùn)練周期,并降低開發(fā)成本。

其現(xiàn)已升級至第三代昆侖芯P800。該芯片采用的是XPU架構(gòu)(eXtensible Processing Unit,可擴展處理單元),這種處理器架構(gòu)比傳統(tǒng)的CPU(中央處理單元)和GPU(圖形處理單元)靈活度更高,可以根據(jù)具體需求和應(yīng)用場景來擴展和定制,從而減少算力的浪費,并提高計算任務(wù)的處理效率。

同時,昆侖芯P800的顯存規(guī)格比同類主流GPU高出20%到50%,可以更好地適配MoE(Mixture of Experts,混合專家模型)架構(gòu),節(jié)省算力消耗,來整體降低開發(fā)成本。

該芯片還支持8-bit量化技術(shù),占用更少的顯存,也能保持較高的推理精度。這意味著千帆DeepSeek一體機單機8卡,也能帶動滿血版DeepSeek等參數(shù)量為671B的大模型。

其次是算力“油箱”,即數(shù)據(jù)中心。

本月,百度智能云宣布完成昆侖芯三代萬卡集群的搭建,并計劃進一步將萬卡規(guī)模拓展至三萬卡。

這一自研萬卡集群可形成規(guī)模效應(yīng),通過多任務(wù)并行處理、彈性算力管理等方式減少算力閑置的情況,以提高計算資源利用率,進而降低模型訓(xùn)練的整體算力成本。

未來,其規(guī)模如果按計劃從萬卡擴大至三萬卡,規(guī)模效應(yīng)加劇,百度的云計算服務(wù)整體成本或?qū)⑦M一步降低。

再者是算力“車底座”,即AI計算平臺。

百舸平臺是百度智能云推出的一個高性能AI計算平臺,主要用于支持大規(guī)模深度學(xué)習(xí)。其通過提升帶寬有效性、減少散熱能耗、優(yōu)化模型訓(xùn)練效率等方式,來降低模型訓(xùn)練整體成本。

據(jù)百度方面最新數(shù)據(jù),百舸4.0的帶寬有效性已提升至90%以上;訓(xùn)練主流開源模型的集群MFU(通常用MFU來表示GPU的有效利用率)提升至58%;模型訓(xùn)練故障恢復(fù)時間從小時級降低到分鐘級,集群有效訓(xùn)練率達到98%。

三、多平臺創(chuàng)新,拉動模型推理成本打骨折

訓(xùn)練和推理都是模型開發(fā)及其應(yīng)用的關(guān)鍵環(huán)節(jié),因此單單降低模型訓(xùn)練的開銷還不夠,模型推理的成本,也需要通過優(yōu)化推理技術(shù)來進一步控制。

截至發(fā)稿,開源社區(qū)Hugging Face上點贊數(shù)排行第一,是國產(chǎn)模型DeepSeek-R1。DeepSeek-R1是基于DeepSeek V3基礎(chǔ)模型訓(xùn)練的高性能推理模型,專注于提升推理能力。

隨著主流大模型廠商相繼接入、蒸餾DeepSeek-R1和DeepSeek V3模型,并且計劃開源自家先進模型,這一格局或?qū)⒈桓膶憽?br/>

不過,調(diào)用DeepSeek-R1和DeepSeek V3的價格卻有高有低。

目前來看,包括DeepSeek自家平臺在內(nèi),調(diào)用DeepSeek-R1和DeepSeek V3每百萬Tokens的單價,定價最便宜的是百度智能云千帆大模型平臺。其R1的調(diào)用價格為DeepSeek官方刊例價的半價,V3的調(diào)用價格是DeepSeek官方刊例價的3折。

中外大模型加速開源+免費!文心一言降本大揭秘,GPT-5緊追

總的來說,百度方面主要通過優(yōu)化以下3大板塊的推理技術(shù),來降低推理成本。

1、百度智能云千帆大模型平臺針對DeepSeek模型MLA結(jié)構(gòu)(Multi-Level Attention,多級注意力)深度優(yōu)化,一方面同步調(diào)用計算、通信和內(nèi)存資源進行推理,另一方面使用Prefill/Decode分離式推理架構(gòu)在推理前先預(yù)處理數(shù)據(jù),從而使模型滿足低延遲標(biāo)準(zhǔn)的同時,大幅提升了吞吐量,并降低了推理成本。

2、百度智能云千帆大模型平臺還通過增強系統(tǒng)容錯能力、減少多輪對話等場景中的重復(fù)計算、增強安全防護欄來整體降低推理成本。

3、有業(yè)內(nèi)人士分析稱,百度飛槳深度學(xué)習(xí)框架,以及百度飛槳自研的并行推理、量化推理等大模型推理相關(guān)技術(shù),可以遷移應(yīng)用于文心一言等百度旗下的AI工具,從而降低這些AI工具的推理成本。

結(jié)語:國內(nèi)外大模型再掘AI增量,智能化加速平民化

作為首批免費開放AI模型的大模型廠商,百度與OpenAI等競爭對手一起,拉開大模型新一輪價格戰(zhàn)的序幕。但這一次,“省成本”不僅僅是為了大模型廠商自身的經(jīng)營,更多是把重心放在了AI技術(shù)推廣上。

而百度在芯片、模型訓(xùn)練、模型應(yīng)用方面持續(xù)探索,通過技術(shù)創(chuàng)新,讓AI逐步走向人人可用、人人用得起、人人用得好的階段。

未來,無論企業(yè)或者個人是否從事AI行業(yè),都有機會在日常生活中收獲AI技術(shù)、AI工具、AI模型的智能化體驗,繼而作為一份子加入AI浪潮,形成AI硬件開發(fā)商、大模型廠商、云服務(wù)商、個人等主體共促AI生態(tài)開放發(fā)展的局面。

贊助本站

相關(guān)內(nèi)容
AiLab云推薦
推薦內(nèi)容
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港