DeepSeek AI最新發布的多模態大模型Janus-Pro,以及之前發布的大型語言模型DeepSeek-R1、DeepSeek-V3及DeepSeek-V2,一經發布,就在AI領域引起了熱烈反響,多項創新技術顯著提升了模型的性能與效率。DeepSeek系列模型首發即支持昇騰平臺,神州數碼旗下神州鯤泰推理服務器產品搭載昇騰硬件,可全面支持DeepSeek系列模型的快速部署,可為用戶帶來更快、更高效、更便捷的AI開發和應用體驗。
2025年2月4日,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區,支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺上開箱即用,推理快速部署,帶來更快、更高效、更便捷的AI開發和應用體驗,歡迎廣大開發者體驗使用。
?下面以Deepseek-V3為例,
演示在昇騰社區如何高效獲取模型及使用
1 硬件要求
部署DeepSeek-V3模型需配置4臺KunTai A924推理服務器(每臺搭載8張昇騰推理卡)
2 模型調用實踐
一、權重轉換
GPU:
NPU:
二、加載鏡像
在昇騰社區/開發資源下載適配DeepSeek-V3的鏡像包:
mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64
完成之后,請使用docker images命令確認查找具體鏡像名稱與標簽。
三、容器啟動
提供的MindIE鏡像預置了DeepSeek-V3模型推理腳本,從您信任的來源自行獲取權重后,放置在從上述下載的模型代碼的主目錄下,修改模型文件夾屬組為1001,執行權限為750,啟動容器。
四、服務化測試
配置服務化環境變量,expandable_segments-使能內存池擴展段功能,即虛擬內存特性。
修改服務化參數
拉起服務化
圖片出現“Daemon start success!”,則認為服務成功啟動。
更深入了解DeepSeek系列模型在昇騰上的使用方法及指導文檔,可登錄昇騰社區模型庫專區學習了解!
更多DeepSeek模型獲取鏈接可參考:
?DeepSeek-R1
https://www.hiascend.com/software/modelzoo/models/detail/68457b8a51324310aad9a0f55c3e56e3
(掃碼獲取)
?DeepSeek-V3:
https://www.hiascend.com/software/modelzoo/models/detail/678bdeb4e1a64c9dae51d353d84ddd15
(掃碼獲取)
?Janus-Pro
https://www.hiascend.com/software/modelzoo/models/detail/ffe1a0f4e8ba43aeb989251a3f0308e9
(掃碼獲取)