DeepSeek橫空出世三個月 撼動雲端巨頭格局
鉅亨網新聞中心 2025-03-12 22:02

在短短三個月內,中國的大模型 DeepSeek 和 AI 應用 Manus 在市場上引起了巨大的反響。DeepSeek 聲稱僅用 2048 張輝達 H800 晶片和 558 萬美元的訓練成本,就訓練出了性能接近 OpenAI GPT-4o 的 DeepSeek-V3 模型。Manus 則利用多代理 (Muti-Agent) 策略開發了一款能獨立思考、計畫並執行複雜任務的 AI 原生應用,被認為是 2025 年 AI 應用的發展方向。
改變 AI 發展重點
儘管市場對 DeepSeek 的算力規模和訓練成本以及對 Manus 的核心競爭力存在一些質疑,但這兩家公司的出現,已成為大模型浪潮三年的一個重要里程碑。它們在這三個月內引發的熱潮預示著,擁有雲業務的大型科技公司 (如亞馬遜、微軟、Google、阿里等) 未來三年的發展路徑將會被改變。
陸媒《財經新媒體》報導,過去三年,大模型競爭的重點在於訓練,但近三個月來,焦點正轉向推理。過去,業界追求使用大量的算力來訓練高性能模型。然而,隨著「規模定律」效應的減緩,單純增加算力帶來的性能提升有限。相反,由於晶片、模型和算法的優化,推理算力的成本正以每年十倍的速度下降。
與此同時,過去三年還處於萌芽期的 AI 應用在這三個月內呈現快速成長的態勢。AI 應用消耗的是推理算力,因此雲端廠商是直接的受益者。
過去,推理算力成本高昂是 AI 應用落地的主要障礙,但隨著成本的降低,許多老牌應用如釘釘、飛書、WPS、美圖秀秀等都在加速疊加新的 AI 功能,而像 Manus 這樣的 AI 代理類原生應用也迅速爆發。AI 應用的爆發帶來了算力消耗的增長,變局正在來臨。
面對這場變革,全球四大雲端廠商——亞馬遜、微軟、Google、阿里都在積極應對,爭相抓住 DeepSeek 帶來的早期市場紅利。這些雲端廠商迅速接入了 DeepSeek,因為 DeepSeek-V3/R1 是開源的,可以被任何人下載、部署和使用。客戶在使用時會消耗算力、數據,進而帶動雲端廠商其他基礎雲產品的銷售。
從封閉生態到開放聯盟的轉型
亞馬遜雲端科技 (AWS) 率先擁抱變革,成為全球首個接入 DeepSeek-R1 的商業化雲端平台。透過 Amazon Bedrock 平台提供全託管服務,AWS 不僅滿足客戶對多模式選型的需求,也藉此鞏固其在 AI 基礎設施市場的主導地位。
Bedrock 整合了包含 DeepSeek、Anthropic Claude、Meta Llama 等十家大模型的 API 接口,支援開發者透過統一介面靈活調用不同模型的優勢能力。 AWS CEO 安迪賈西 (Andy Jassy) 明確表示:「企業需要多樣化的模型工具,而非單一技術壟斷。」這個策略背後,是 AWS 對「模型碎片化」趨勢的敏銳洞察——未來企業業務場景的複雜性將催生對專用模型的需求。
阿里雲選擇正面迎戰,春節期間緊急推出對標 DeepSeek-V3 的 Qwen2.5-Max 模型,並宣布開放千億參數大模型的免費試用。此舉既是對技術落後的被動防禦,亦試圖透過性價比優勢爭奪中小企業市場。阿里雲智慧技術長週靖人透露,Qwen2.5-Max 在中文語意理解與長文本處理能力較前代提升 40%,且訓練成本降低 60%。此外,阿里雲也推出「雲端智一體」策略升級計劃,將 AI 能力深度整合至雲端運算基礎設施,為企業提供「開箱即用」的智慧運算服務。
微軟與 OpenAI 獻出效能碾壓策略,推出運算效率提升 10 倍的 GPT-4.5 及輕量化模型 O3-Mini。 GPT-4.5 透過改進上下文視窗壓縮演算法,在保持 128K 上下文長度的同時,推理延遲縮短至 0.8 秒。微軟 Azure AI 負責人 Eric Boyd 表示:「我們的目標是讓每個開發者都能在 100 美元預算內體驗最先進的 AI 能力。」而 Google 則依托 Gemini 2.0 Pro Experimental 強化多模態能力,其影像理解準確率較前代提升 25%,並在醫療影像診斷領域取得突破性進展。
推理算力成新戰場
此次變革的核心在於 AI 競爭焦點的轉移。過去三年,業界圍繞著「訓練算力軍備競賽」展開角逐,輝達 H100 晶片價格一度飆升至每張 8 萬美元。而今隨著 Scaling Law(規模定律) 邊際效益遞減,推理算力成本以每年十倍速度下降,成為新的決勝點。市場研究機構 IDC 數據顯示,2024 年全球 AI 推理市場規模達 1,200 億美元,預計 2025 年將突破 2,000 億美元。
釘釘、飛書等辦公室軟體及美圖秀等工具應用加速嵌入 AI 功能,推動推理需求激增。例如,釘釘智慧助理「酷應用」日均調用推理算力超 1 億次,較半年前增加 50 倍。美圖秀秀推出的 AI 修圖工具「魔法摳圖」,其單次請求包含數百次模型推理操作,對算力調度效率提出極高要求。雲端廠商的戰略重心隨之調整:AWS 透過 Bedrock 平台的 Guardrails 功能降低 DeepSeek-R1 的幻覺率至 14.3%,谷歌則為 Gemini 模型適配企業級安全防護,阿里雲推出 “推理成本減半計劃”,試圖以價格戰爭奪長尾市場。
爭議與挑戰並存
這場變革並非毫無隱憂。 DeepSeek 的算力數據遭質疑「過度優化」-其宣稱的 558 萬美元成本未計入數據標註與模型蒸餾費用,實際支出可能高出 30%-50%。 Manus 的 Multi-Agent 技術被批評為 “整合創新而非原始突破”,其核心依賴的 Prompt 工程優化與現有 Agent 框架並無本質差異。更嚴峻的是,新創企業的突圍加劇了大廠內部的技術路線分歧。某國際雲端廠商高層坦言:「我們曾自信能掌控 AI 未來,但現在必須承認,顛覆可能來自任何角落。」
技術路線的爭議背後,是更深層的生態博弈。 OpenAI 近期宣布將限制部分企業客戶對 GPT-4o 的存取權限,引發開發者社群強烈反彈。而 DeepSeek 選擇開源策略,其 DeepSeek-V3 程式碼已在 GitHub 開源,社群貢獻者已提交超過 2000 個優化補丁。這種「開放對抗封閉」的模式,或將重塑 AI 產業生態格局。
模型小型化與邊緣智慧成未來戰場
報導認為,AI 產業或將呈現「雙軌並行」格局:一方面,大廠依托資金與生態優勢鞏固基礎設施地位,亞馬遜 AWS、微軟 Azure 等將持續加碼模型即服務 (MaaS);另一方面,新創公司透過技術創新持續衝擊既有秩序,DeepSeek 已啟動新一輪融資,估值逼近 500 億美元。正如 AWS 首席技術官所言:「這場競賽的終點不再是模型參數量的比拼,而是誰能更快解決真實世界的商業問題。」
延伸閱讀
下一篇