科技

545%！DeepSeek首披露成本利潤率專家：若在美國已是一家價值逾百億美元公司

鉅亨網編譯陳韋廷綜合報導2025-03-03 13:40

中國 AI 新創公司 DeepSeek 近來「開源」一波波，上周六 (1 日) 又有更大驚喜，全面揭秘 DeepSeek-V3/R1 推理系统，不僅公開其推理系統的核心優化方案，更首次披露成本獲利率等關鍵數據，引發產業震動。

cover image of news article — 545%！DeepSeek首披露成本利潤率專家：若在美國已是一家價值逾百億美元公司（圖：Shutterstock）

DeepSeek 上周六在知乎平台發佈首條文章，公佈模型推理成本利潤細節，並披露成本獲利率關鍵資訊，若所有 tokens 全按 DeepSeek-R1 的定價計算，理論上一天的總收入為 56 萬 2027 美元，成本獲利率為 545%，這一數字刷新全球 AI 大模型領域的獲利天花板。

‌

根據 DeepSeek 官方披露，DeepSeek V3 和 R1 的所有服務均使用 H800 GPU，使用和訓練一致的精度，即矩陣計算和 dispatch 傳輸採用和訓練一致的 FP8 格式，core-attention 計算和 combine 傳輸採用和訓練一致的 BF16，最大程度保證了服務效果。

在最近 24 小時 (2025 年 2 月 27 日 12：00 至 28 日 12：00) 的統計週期，若 GPU 租賃成本按 2 美元 / 小時計算，日均成本為 8 萬 7072 美元，而若所有輸入 / 輸出 token 按 R1 定價 (輸入 1 元 / 百萬 token、輸出 16 元 / 百萬 token) 計算，單日收入可達 56 萬 2027 美元(約 1865 萬台幣)，成本獲利率高達 545%。

MenloVentures 投資人 Deedy 在看完上述數據後指出，獲利率超過 500% 這一商業效率在美國將是一家價值逾百億美元的公司。

中國矽基流動創辦人袁進輝也在第一時間發表了自己的感受說：「DeepSeek 官方披露大規模部署成本和收益，又一次顛覆了很多人認知。」

DeepSeek 的高獲利率源於其創新的推理系統設計，核心包括大規模跨節點專家並行 (EP)、計算通信重疊與負載均衡優化三大技術支柱。EP 提升吞吐與回應速度，針對模型稀疏性 (每層僅啟動 8/256 個專家)，採用 EP 策略擴展總體批處理規模，確保每個專家獲得足夠的計算負載，顯著提升 GPU 利用率，部署單元動態調整 (如 Prefill 階段 4 節點、Decode 階段 18 節點)，平衡資源分配與任務需求。

簡言之，EP 就像是「多人協作」，把模型中的「專家」分散到多張 GPU 上進行計算，大幅提升 Batch Size，榨乾 GPU 算力，同時專家分散，降低記憶體壓力，更快回應。

DeepSeek 在工程層面進一步壓縮成本，加上晝夜資源調配，白天高峰時段全力支援推理服務，夜間閒置節點轉用於研發訓練，最大化硬體利用率，緩存命中率達 56.3%，通過 KVCache 硬碟緩存減少重複計算，在輸入 token 中，有 3420 億個 (56.3%) 直接命中緩存，大幅降低算力消耗。

有分析稱 DeepSeek 此次披露的數據，不僅驗證其技術路線的商業可行性，更為行業樹立高效獲利標竿，模型訓練成本僅為同類產品的 1% 至 5%，此前發佈的 DeepSeek-V3 模型訓練成本僅 557.6 萬美元，遠低於 OpenAI 等巨頭。在推理定價優勢方面，DeepSeek-R1 的 API 定價僅為 OpenAI o3-mini 的七分之一到一半左右，低成本策略加速市場滲透。

還有分析指出，DeepSeek 此次「透明化」披露不僅展示其技術實力與商業潛力，更向行業傳遞明確信號，也就是 AI 大模型的獲利循環已從理想照進現實，代表 AI 技術從實驗室邁向產業化的關鍵轉折。

不過，DeepSeek 官方坦言實際上沒有這麼多收入，因 V3 定價更低，同時收費服務只佔了一部分，另外夜間還會有折扣。

中信證券認為，Deepseek 在模型訓練成本降低方面的最佳實踐，料將刺激科技巨頭採用更經濟方式加速前沿模型的探索和研究，同時將使得大量 AI 應用得以解鎖和落地。演算法訓練帶來的規模報酬遞增效應，以及單位算力成本降低對應的傑文斯悖論等，均代表中短期維度科技巨頭繼續在 AI 算力領域進行持續、規模投入仍將是高確定性事件。