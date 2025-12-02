鉅亨網編譯陳韋廷 2025-12-02 11:30

AI 領域再掀波瀾！被譽為「開源之神」的 DeepSeek 周一 (1 日) 晚間正式發布 DeepSeek-V3.2 版本，這一全新模型在多項關鍵指標上實現了重大突破，性能全面超越 OpenAI 的 GPT-5 High，與谷歌最強的 Gemini-3.0 Pro 平分秋色。

OpenAI危險了！DeepSeek正式發佈V3.2 性能勝GPT-5 High追平谷歌Gemini-3.0 Pro（圖：Shutterstock）

DeepSeek-V3.2 包含兩個版本，一個是面向日常應用的 V3.2 以及專為 AI 智能體打造的推理優先模型 V3.2-Speciale。根據評測數據，V3.2-Speciale 在多項國際頂尖競賽中獲得金牌級成績，像是國際數學奧林匹克競賽 (IMO 2025)、中國數學奧林匹克競賽 (CMO 2025)、國際大學生程式設計競賽全球總決賽 (ICPC 2025)、國際資訊學奧林匹克競賽 (IOI 2025)。

值得注意的是，在 ICPC 和 IOI 競賽中，模型的表現分別達到了人類選手第二名和第十名的水平，展現了卓越的推理能力。

DeepSeek-V3.2 最大的技術亮點在於其獨創的稀疏注意力 (DSA) 架構，這項技術突破了傳統 AI 模型的算力限制，實現了「速度、成本、智慧」三大要素的平衡。

當問題來臨時，DSA 先用極低的成本掃描一遍「索引」，瞬間判斷出哪幾頁書可能包含答案，把無關的 99% 的廢話直接扔掉，然後 DSA 只對這篩選出的 1% 的關鍵內容進行精細的深度閱讀，這一策略將計算複雜度從可怕的指數級直接拉低到了近乎線性（O（L））。

與傳統模型需要處理全部資訊不同，DSA 架構能夠智慧篩選關鍵訊息，將運算複雜度從指數級降​​低到近乎線性。這項突破使得模型在處理長文本時，既能保持高速響應，又能大幅降低成本。

首先，對用戶來說，丟給模型一本幾十萬字的小說或代碼庫不再是「燒錢」的奢侈行為，處理速度也從「泡杯咖啡」變成了「眨眼之間」。

其次，算力盈餘帶來的「智力湧現」，這是最精彩的一點，而正因為 DSA 節省了大量算力，DeepSeek 才有底氣推出 Speciale 版本，Speciale 版本利用節省下來的資源，進行更深度的「長思考」和邏輯推演。

相較於實驗版，DeepSeek-V3.2 正式版在智能體能力上實現了重大演化，該模型引入「思維脈絡管理」機制，解決了 AI 領域長期存在的「思考與行動斷裂」問題。

這項創新使得模型能夠像經驗豐富的外科醫生一樣，在調用工具的間隙保持思維連貫性，實現「邊幹邊想」的高效工作模式。為達到此效果，DeepSeek 為模型建構了包含 1800 多個虛擬環境的訓練系統，透過 8.5 萬個複雜指令進行強化訓練。

DeepSeek 繼續保持其開源承諾，兩款模型均已開源並在 HuggingFace 和 ModelScope 平台上線。這項舉措將進一步推動 AI 技術的發展與普及。