科技

DeepSeek推出V3.1模型擴大對話與記憶能力

鉅亨網編譯段智恆2025-08-19 23:10

中國新創公司深度求索 (DeepSeek) 周二 (19 日) 宣布，推出其人工智慧 (AI) 模型 V3 的升級版 V3.1，並表示已經準備好進入測試階段。

cover image of news article — DeepSeek推出V3.1模型擴大對話與記憶能力(圖：REUTERS/TPG)

根據該公司在官方微信社群的貼文，V3.1 的主要改進在於擴展了上下文長度 (context window)，意味著模型能在處理單一查詢時考慮更多資訊，從而更好地維持長對話，並提升記憶與回溯能力。不過，DeepSeek 尚未公開更完整的技術細節，也沒有在 Hugging Face 等主流平台發布相關文件。

‌

這家位於杭州的初創公司，近年憑藉 AI 模型的低成本與高效能，快速挑戰美國同業如 OpenAI。特別是今年稍早亮相的 R1 模型，在多項標準化測試中表現超越西方對手，令業界震驚，也讓外界開始關注中國 AI 在全球的競爭力。

不過，粉絲們仍在等待 R1 的後繼者 R2。據中國媒體報導，DeepSeek 執行長梁文鋒因追求完美與模型故障問題，導致研發進度延宕。儘管如此，V3.1 的釋出仍顯示 DeepSeek 在持續推進旗下 AI 模型迭代，並持續擴大與國際對手的競爭。