夢晨 發(fā)自 凹非寺量子位 | 公眾號 QbitAI
DeepSeek的含金量還在上升,一個半個周末過去發(fā)生這些大事:
國家超算互聯(lián)網(wǎng)平臺上線DeepSeek-R1,最高支持671B的滿血版。
平頭哥玄鐵芯片成功適配DeepSeek-R1系列蒸餾模型,在RISC-V架構(gòu)CPU和端側(cè)平臺打開新的應(yīng)用空間。
再加上春節(jié)期間的三大運營商全面接入DeepSeek等消息,它的影響力已不僅限于AI和互聯(lián)網(wǎng),正在往產(chǎn)業(yè)更深層進發(fā)。
總之,對于用戶和開發(fā)者來說不用再看“服務(wù)器繁忙”的臉色,可以多換幾個地方再試了。
隨著官方服務(wù)器不堪重負,以及DeepSeek-V3 API優(yōu)惠結(jié)束恢復原價,各大云服務(wù)商也抓住機會卷了起來。
云服務(wù)卷價格,新式芯片卷速度騰訊云率先上線支持聯(lián)網(wǎng)搜索的DeepSeek,結(jié)合自家旗下搜狗搜索提供搜索增強API。
同時支持集成私域知識庫,一鍵整合RAG。
商湯和阿里直接卷起了價格。
商湯大裝置平臺上3個月內(nèi)可限時免費使用1000萬tokens,同時支持128K最大上下文長度限制。
阿里云為新用戶提供100萬免費tokens,同時蒸餾版模型價格也比較低。
與此同時,各類芯片正在輸出速度上展開激烈競爭。
通用GPU方面,AMD員工透露MI300X上的DeepSeek-R1滿血版速度比剛發(fā)布時已經(jīng)快了3倍,并發(fā)布官方Docker Image鏡像。
在英偉達與CUDA生態(tài)之外,提供AMD與ROCm的另一種選擇。
三大新型AI推理芯片Groq、Cerebras、Sambanova已經(jīng)把DeepSeek-R1-Distill Llama-70B搞到了每秒500-1500tokens。
快到你都看不清發(fā)生了什么,推理思維鏈完成了、代碼寫完了,一眨眼直接運行了。
△groq芯片運行DeepSeek-R1-Distill Llama-70B
One More Thing還有一條有意思的消息,ai.com域名現(xiàn)在已定向到DeepSeek官網(wǎng)。
甚至有傳言稱是DeepSeek重金拿下了該域名。
不過一直關(guān)注大模型的朋友可能還記得,這個域名曾先后定位到ChatGPT和xAI。
大概率是域名所有人個人行為~
國家超算互聯(lián)網(wǎng)平臺https://www.scnet.cn/騰訊云DeepSeek專題https://cloud.tencent.com/developer/special/deepseek阿里云DeepSeek解決方案https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms商湯大裝置https://www.sensecore.cn
參考鏈接:[1]https://x.com/AnushElangovan/status/1888006978959741390[2]https://x.com/Dev__Digest/status/1887337604267332022