美股

推理成本暴降70%！高盛：Google TPU強勢追趕 AI晶片競爭轉向「經濟效益」

鉅亨網新聞中心2026-01-21 22:00

隨著 AI 資本支出維持高位且商業化壓力日益增加，市場對於 AI 運算的關注點正發生深刻轉移。高盛在最新的 AI 晶片研究報告中指出，Google(GOOGL-US) 與博通 (AVGO-US) 共同開發的 TPU 正迅速縮小與輝達 (NVDA-US) GPU 在推理成本上的差距。

cover image of news article — 高盛：Google TPU強勢追趕 AI晶片競爭轉向「經濟效益」(圖:shutterstock)

從算力競賽轉向成本效率

‌

高盛報告揭示，AI 晶片競爭的核心評價體系正在從「誰算得更快」轉向「誰算得更便宜、更可持續」。透過建構「推理成本曲線」，高盛分析了不同方案在折舊、能耗及系統利用率下的真實成本。

數據顯示，從 TPU v6 升級至 TPU v7，單位符碼 (token) 的推理成本大幅下降約 70%。這使得 TPU v7 在絕對成本上已與輝達的 GB200 NVL72 基本持平，甚至在部分測算情境中更具優勢。

系統工程能力與成本

高盛認為，TPU 能實現如此顯著的降本，並非依賴單一技術，而是系統級優化能力的集中釋放。這包括更高帶寬與低延遲的網路互聯、HBM 內存的集成、台積電 (TSM-US)(2330-TW) 的 CoWoS 先進封裝技術，以及機架級解決方案在密度與能效上的提升。

目前，Google 內部已廣泛將 TPU 用於 Gemini 模型的訓練與推理；外部客戶如 Anthropic 也向博通下達了高達 210 億美元的訂單，預計相關產品將於 2026 年中交付。

產業格局：GPU 與 ASIC 的分工與競爭

高盛指出，儘管 TPU 表現強勁，但輝達仍掌握「上市時間」的領先優勢，其產品迭代速度 (如 GB300 及未來的 VR200) 與 CUDA 軟體生態系仍是維持客戶黏性的關鍵護城河。相比之下，AMD(AMD-US) 與亞馬遜 (AMZN-US) 的 Trainium 方案在代際降本幅度上約為 30%，目前的單位推理成本仍明顯高於輝達與 Google。

不過，高盛也看好 AMD 機架方案的後發優勢，預期其 MI455X 在 2026 年底有潛力實現顯著降本。

從投資角度看，高盛維持對輝達與博通的「買入」評級，認為兩者最能直接受益於 AI 資本支出。未來 AI 產業將形成明確分工：GPU 繼續主導訓練與通用算力，而客製化 ASIC 則將在規模化、可預測的推理負載中持續滲透。當 AI 進入「每一個 Token 都要計算回報」的階段，算力競爭終將回歸經濟學本質。