展會信息港展會大全

神州數(shù)碼旗下神州鯤泰推理服務(wù)器全面支撐DeepSeek系列模型部署
來源:互聯(lián)網(wǎng)   發(fā)布日期:2025-02-06 10:39:24   瀏覽:109次  

導(dǎo)讀:DeepSeek AI最新發(fā)布的多模態(tài)大模型Janus-Pro,以及之前發(fā)布的大型語言模型DeepSeek-R1、DeepSeek-V3及DeepSeek-V2,一經(jīng)發(fā)布,就在AI領(lǐng)域引起了熱烈反響,多項創(chuàng)新技術(shù)顯著提升了模型的性能與效率。DeepSeek系列模型首發(fā)即支持昇騰平臺,神州數(shù)碼旗下神州鯤泰推理服務(wù)器產(chǎn)品搭載昇騰硬件,可全面支持DeepSeek系列模型的快速部署,可為用戶帶來更快、更高效、更便捷的AI開發(fā)和應(yīng)用體驗 ......

DeepSeek AI最新發(fā)布的多模態(tài)大模型Janus-Pro,以及之前發(fā)布的大型語言模型DeepSeek-R1、DeepSeek-V3及DeepSeek-V2,一經(jīng)發(fā)布,就在AI領(lǐng)域引起了熱烈反響,多項創(chuàng)新技術(shù)顯著提升了模型的性能與效率。DeepSeek系列模型首發(fā)即支持昇騰平臺,神州數(shù)碼旗下神州鯤泰推理服務(wù)器產(chǎn)品搭載昇騰硬件,可全面支持DeepSeek系列模型的快速部署,可為用戶帶來更快、更高效、更便捷的AI開發(fā)和應(yīng)用體驗。

2025年2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺上開箱即用,推理快速部署,帶來更快、更高效、更便捷的AI開發(fā)和應(yīng)用體驗,歡迎廣大開發(fā)者體驗使用。

神州數(shù)碼旗下神州鯤泰推理服務(wù)器全面支撐DeepSeek系列模型部署

下面以Deepseek-V3為例,

演示在昇騰社區(qū)如何高效獲取模型及使用

1硬件要求

部署DeepSeek-V3模型需配置4臺KunTai A924推理服務(wù)器(每臺搭載8張昇騰推理卡)

神州數(shù)碼旗下神州鯤泰推理服務(wù)器全面支撐DeepSeek系列模型部署

2模型調(diào)用實踐

一、 權(quán)重轉(zhuǎn)換

GPU:

神州數(shù)碼旗下神州鯤泰推理服務(wù)器全面支撐DeepSeek系列模型部署

NPU:

神州數(shù)碼旗下神州鯤泰推理服務(wù)器全面支撐DeepSeek系列模型部署

二、 加載鏡像

在昇騰社區(qū)/開發(fā)資源下載適配DeepSeek-V3的鏡像包:

mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64

完成之后,請使用docker images命令確認(rèn)查找具體鏡像名稱與標(biāo)簽。

神州數(shù)碼旗下神州鯤泰推理服務(wù)器全面支撐DeepSeek系列模型部署

三、 容器啟動

提供的MindIE鏡像預(yù)置了DeepSeek-V3模型推理腳本,從您信任的來源自行獲取權(quán)重后,放置在從上述下載的模型代碼的主目錄下,修改模型文件夾屬組為1001,執(zhí)行權(quán)限為750,啟動容器。

神州數(shù)碼旗下神州鯤泰推理服務(wù)器全面支撐DeepSeek系列模型部署

神州數(shù)碼旗下神州鯤泰推理服務(wù)器全面支撐DeepSeek系列模型部署

四、 服務(wù)化測試

配置服務(wù)化環(huán)境變量,expandable_segments-使能內(nèi)存池擴展段功能,即虛擬內(nèi)存特性。

神州數(shù)碼旗下神州鯤泰推理服務(wù)器全面支撐DeepSeek系列模型部署

修改服務(wù)化參數(shù)

神州數(shù)碼旗下神州鯤泰推理服務(wù)器全面支撐DeepSeek系列模型部署

拉起服務(wù)化

神州數(shù)碼旗下神州鯤泰推理服務(wù)器全面支撐DeepSeek系列模型部署

圖片出現(xiàn)“Daemon start success!”,則認(rèn)為服務(wù)成功啟動。

更深入了解DeepSeek系列模型在昇騰上的使用方法及指導(dǎo)文檔,可登錄昇騰社區(qū)模型庫專區(qū)學(xué)習(xí)了解!



贊助本站

相關(guān)內(nèi)容
AiLab云推薦
展開

熱門欄目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能實驗室 版權(quán)所有    關(guān)于我們 | 聯(lián)系我們 | 廣告服務(wù) | 公司動態(tài) | 免責(zé)聲明 | 隱私條款 | 工作機會 | 展會港