扶植本土供應鏈!DeepSeek遭爆拒向美晶片商公開V4模型 旨在削弱美硬體優勢
鉅亨網編譯余曉惠
中國人工智慧 (AI) 實驗室 DeepSeek 去年以低成本模型震撼全球市場,目前正準備在農曆新年後發布重大更新版本 V4,但消息人士向路透披露,DeepSeek 並未按慣例把新一代模型提供給美國晶片製造商進行效能優化,而是選擇向華為在內的中國本土供應商提供提前存取權限,打破了重大模型更新前的標準產業作法。

一般來說,AI 開發商在發表重大模型前,會與輝達 (NVDA-US) 及超微 (AMD-US) 等主要晶片製造商分享預發布版本,以確保軟體能在廣泛使用的硬體上高效運行。
未向輝達、超微提供權限
DeepSeek 過去也曾與輝達的技術團隊密切合作,但消息人士表示,DeepSeek 的新模型預定農曆新年前後發表,但目前仍未向輝達與超微提供存取權,而是讓包括華為在內的中國晶片製造商,提前數周進行軟體優化。
輝達與超微拒絕評論此事,DeepSeek 與華為未回應置評請求。
研究機構 Creative Strategies 執行長 Ben Bajarin 說:「DeepSeek 對輝達與超微的通用數據加速器造成的影響微乎其微。大多數企業並未運用 DeepSeek,比較像是當成某種基準測試的模型。」隨著新的 AI 編碼工具出現,軟體與硬體磨合的時間已從幾個月縮短為幾周。
專家推測為中國政府戰略
不過 Bajarin 進一步指出,此舉可能是中國政府更廣泛戰略的一環,「目的在讓美國硬體與模型在中國處於劣勢」。
此傳言曝光之際,日前才有一名川普政府高級官員表示,DeepSeek 最新 AI 模型是透過中國一個運算叢集使用輝達最先進的 Blackwell 晶片所訓練完成的,然而此做法似乎已違反美國出口管制規定。
這名美國官員表示,DeepSeek 可能試圖移除顯示曾使用美國 AI 晶片的痕跡,並計劃對外宣稱自家模型是用華為晶片訓練完成的。
DeepSeek 模型自 2025 年 1 月爆紅以來,在開源平台 Hugging Face 上的下載次數已超過 7500 萬次,並在中國掀起一波開源模型浪潮,與美國 AI 實驗室競爭。過去一年發布的模型中,中國模型在該平台的下載量已超越其他國家。
隨著中國開源模型迅速崛起,有關華府是否應向中國出口先進 AI 晶片的辯論也加劇。美國去年允許輝達 H20 及超微 MI308 晶片恢復出口中國,但對更先進處理器的出口許可仍有限制。目前尚不清楚,DeepSeek 是否已獲准採購相關美國晶片。
H20 與 MI308 晶片主要用於推論,也就是運行已訓練完成的 AI 模型。超微曾表示 MI308 需求強勁,最近一季創造 3.9 億美元銷售額。
- 聽聽專家怎麼解讀關稅、利率和匯率
- 掌握全球財經資訊點我下載APP
延伸閱讀
- DeepSeek新模型下週登場 遭爆以走私輝達Blackwell訓練
- 助DeepSeek提升AI效率 輝達遭美國國會審查 是否助長中國軍事AI
- 「DeepSeek時刻」周年 中國模型利用開源推動 全球市占升至15%
- 「DeepSeek時刻」1周年:下一代旗艦Model1現蹤、中國開源AI進入爆發期
- 講座
- 公告
上一篇
下一篇