鉅亨網新聞中心
近日,DeepSeek-V4 預覽版正式上線並同步開源,推出 DeepSeek-V4-Pro 與 DeepSeek-V4-Flash 兩款模型。據陸媒《科創板日報》報導,這次發布與以往最大的不同在於,DeepSeek-V4 不再僅依賴輝達的 CUDA 框架,而是成功在華為昇騰 NPU 上完成了細粒度專家並行方案的驗證。這象徵著中國 AI 產業正朝著「國產算力 + 國產大模型」的閉環生態邁進,走向算力底座邁向多元化。
目前,華為昇騰超節點全系列產品已全面支持 DeepSeek-V4,並實現了極速推理:Pro 模型延遲僅 20ms,Flash 模型則達 10ms。
除了華為,沐曦、寒武紀、摩爾線程、天數智芯等多家中國產晶片廠商也宣佈支持新模型。
在軟硬體協同方面,由智源研究院牽頭的 FlagOS 已完成 DeepSeek-V4-Flash 在海光、沐曦、平頭哥真武、昆侖芯等 8 款以上中國產晶片的全量適配。
沐曦股份聯合創始人楊建表示,這次適配讓中國產 GPU 成為創造知識時代的生產力工具,目前包含 Minimax、階躍星辰、Kimi、智譜 GLM 等模型,皆能基於中國產 GPU 算力實現具備性價比的推理任務。
隨著 DeepSeek-V4 的發布,百度雲、阿里雲、華為雲等主流雲端服務商已迅速提供 API 服務。阿里、字節跳動等頭部雲廠商已開始部署相關國產算力,並從「試點」轉向「大規模商用」。
CIC 灼識諮詢董事總經理陳一心指出,DeepSeek 的成功證明了中國產算力同樣能運行世界級大模型,這將吸引更多開發者轉向國產平台,逐步打破對輝達生態的依賴。
為了確保適配品質,中國信息通信研究院已啟動 DeepSeek-V4 國產化適配測試,針對服務器、一體機、集群及開發框架等軟硬體產品進行全面驗證。
受益於算法創新與硬體協同,DeepSeek 全系列 API 已大幅降價,輸入緩存命中的價格降至原有價格的 1/10。DeepSeek 表示,待今年下半年昇騰 950 超節點批量上市後,Pro 模型的價格預計將進一步大幅下調。
儘管單位算力成本下降,但由於 AI 採用率與工作負載規模的擴大,總算力支出不減反增。中信證券研報預測,2026 年中國產算力晶片出貨量將實現翻倍以上增長,為算力設計、先進封裝及存儲等產業鏈提供強勁動能。
上一篇
下一篇
