545%!DeepSeek首披露成本利潤率 專家:若在美國 已是一家價值逾百億美元公司
鉅亨網編譯陳韋廷 綜合報導 2025-03-03 13:40

中國 AI 新創公司 DeepSeek 近來「開源」一波波,上周六 (1 日) 又有更大驚喜,全面揭秘 DeepSeek-V3/R1 推理系统,不僅公開其推理系統的核心優化方案,更首次披露成本獲利率等關鍵數據,引發產業震動。
DeepSeek 上周六在知乎平台發佈首條文章,公佈模型推理成本利潤細節,並披露成本獲利率關鍵資訊,若所有 tokens 全按 DeepSeek-R1 的定價計算,理論上一天的總收入為 56 萬 2027 美元,成本獲利率為 545%,這一數字刷新全球 AI 大模型領域的獲利天花板。
根據 DeepSeek 官方披露,DeepSeek V3 和 R1 的所有服務均使用 H800 GPU,使用和訓練一致的精度,即矩陣計算和 dispatch 傳輸採用和訓練一致的 FP8 格式,core-attention 計算和 combine 傳輸採用和訓練一致的 BF16,最大程度保證了服務效果。
在最近 24 小時 (2025 年 2 月 27 日 12:00 至 28 日 12:00) 的統計週期,若 GPU 租賃成本按 2 美元 / 小時計算,日均成本為 8 萬 7072 美元,而若所有輸入 / 輸出 token 按 R1 定價 (輸入 1 元 / 百萬 token、輸出 16 元 / 百萬 token) 計算,單日收入可達 56 萬 2027 美元(約 1865 萬台幣),成本獲利率高達 545%。
MenloVentures 投資人 Deedy 在看完上述數據後指出,獲利率超過 500% 這一商業效率在美國將是一家價值逾百億美元的公司。
中國矽基流動創辦人袁進輝也在第一時間發表了自己的感受說:「DeepSeek 官方披露大規模部署成本和收益,又一次顛覆了很多人認知。」
DeepSeek 的高獲利率源於其創新的推理系統設計,核心包括大規模跨節點專家並行 (EP)、計算通信重疊與負載均衡優化三大技術支柱。EP 提升吞吐與回應速度,針對模型稀疏性 (每層僅啟動 8/256 個專家),採用 EP 策略擴展總體批處理規模,確保每個專家獲得足夠的計算負載,顯著提升 GPU 利用率,部署單元動態調整 (如 Prefill 階段 4 節點、Decode 階段 18 節點),平衡資源分配與任務需求。
簡言之,EP 就像是「多人協作」,把模型中的「專家」分散到多張 GPU 上進行計算,大幅提升 Batch Size,榨乾 GPU 算力,同時專家分散,降低記憶體壓力,更快回應。
DeepSeek 在工程層面進一步壓縮成本,加上晝夜資源調配,白天高峰時段全力支援推理服務,夜間閒置節點轉用於研發訓練,最大化硬體利用率,緩存命中率達 56.3%,通過 KVCache 硬碟緩存減少重複計算,在輸入 token 中,有 3420 億個 (56.3%) 直接命中緩存,大幅降低算力消耗。
有分析稱 DeepSeek 此次披露的數據,不僅驗證其技術路線的商業可行性,更為行業樹立高效獲利標竿,模型訓練成本僅為同類產品的 1% 至 5%,此前發佈的 DeepSeek-V3 模型訓練成本僅 557.6 萬美元,遠低於 OpenAI 等巨頭。在推理定價優勢方面,DeepSeek-R1 的 API 定價僅為 OpenAI o3-mini 的七分之一到一半左右,低成本策略加速市場滲透。
還有分析指出,DeepSeek 此次「透明化」披露不僅展示其技術實力與商業潛力,更向行業傳遞明確信號,也就是 AI 大模型的獲利循環已從理想照進現實,代表 AI 技術從實驗室邁向產業化的關鍵轉折。
不過,DeepSeek 官方坦言實際上沒有這麼多收入,因 V3 定價更低,同時收費服務只佔了一部分,另外夜間還會有折扣。
中信證券認為,Deepseek 在模型訓練成本降低方面的最佳實踐,料將刺激科技巨頭採用更經濟方式加速前沿模型的探索和研究,同時將使得大量 AI 應用得以解鎖和落地。演算法訓練帶來的規模報酬遞增效應,以及單位算力成本降低對應的傑文斯悖論等,均代表中短期維度科技巨頭繼續在 AI 算力領域進行持續、規模投入仍將是高確定性事件。
- 掌握全球財經資訊點我下載APP
延伸閱讀
上一篇
下一篇