DeepSeek推出V3.1模型 擴大對話與記憶能力
鉅亨網編譯段智恆
中國新創公司深度求索 (DeepSeek) 周二 (19 日) 宣布,推出其人工智慧 (AI) 模型 V3 的升級版 V3.1,並表示已經準備好進入測試階段。

根據該公司在官方微信社群的貼文,V3.1 的主要改進在於擴展了上下文長度 (context window),意味著模型能在處理單一查詢時考慮更多資訊,從而更好地維持長對話,並提升記憶與回溯能力。不過,DeepSeek 尚未公開更完整的技術細節,也沒有在 Hugging Face 等主流平台發布相關文件。
這家位於杭州的初創公司,近年憑藉 AI 模型的低成本與高效能,快速挑戰美國同業如 OpenAI。特別是今年稍早亮相的 R1 模型,在多項標準化測試中表現超越西方對手,令業界震驚,也讓外界開始關注中國 AI 在全球的競爭力。
不過,粉絲們仍在等待 R1 的後繼者 R2。據中國媒體報導,DeepSeek 執行長梁文鋒因追求完美與模型故障問題,導致研發進度延宕。儘管如此,V3.1 的釋出仍顯示 DeepSeek 在持續推進旗下 AI 模型迭代,並持續擴大與國際對手的競爭。
- 11/12吳嘉隆、盧燕俐聯手解析投資新局
- 掌握全球財經資訊點我下載APP
延伸閱讀
- 〈美股早盤〉零售財報開跑!主要指數漲跌互現 市場聚焦Fed政策訊號
- 美商務部長證實洽談入股英特爾 晶片法案補助金擬改成股權投資
- 蘋果成功守住用戶隱私 英國放棄「開後門」計畫
- 軟銀與美國政府雙重資金救援!英特爾翻身機會浮現
- 講座
- 公告
上一篇
下一篇