DeepSeek V3大升級!代碼能力飆升接近Claude3.7 海外網友:跟免費獲得法拉利差不多
鉅亨網編譯陳韋廷 綜合報導 2025-03-25 09:50

DeepSeek 周一 (24 日) 晚上悄悄推出最新的 DeepSeek-V3-0324 模型,雖非外界預期的 R2 模型,但仍然有不少亮點,從網友實測後的反應來看,升級後的 V3 編碼能力已經接近 Claude3.7,數學能力也有提升,能像推理模型一樣能夠解題。
中國媒體《智東西》報導,一位海外 AI 部落客表示,DeepSeek 終於能在代碼領域和 Anthropic 的 Claude Sonnet 3.5 一決高下,之前 Claude Sonnet 3.5 在程式師圈內擁有極高聲譽,無論諸多模型在代碼上的成績如何變化,程式設計師依舊更青睞使用 Claude 系列模型。
在具體的測試中,DeepSeek-V3 在網站開發和 UI 設計方面也表現出色。當輸入「設計一個美觀的個人部落格網站,帶有科技感,直接開發成可用網頁」的指令時,DeepSeek-V3 在 2 分鐘內產生一個包含 400 多行程式碼的網站。這個網站不僅設計精良,採用粒子背景動畫、賽博龐克 UI 等設計元素,同時也具備響應式設計,能自動適配手機和桌上型設備。
相較之下,舊版 DeepSeek-V3 在同一指令下的表現則顯得遜色許多,解決方案僅有 100 多行程式碼,且美學效果不佳。
在數學能力方面,DeepSeek-V3 也有顯著提升。《智東西》實測後發現,將之前難倒舊版 DeepSeek-V3 和 DeepSeek-R1 的數學題目交給新版模型進行測試,DeepSeek-V3 此次輸出的 token 數量明顯增加,單次輸出達到了輸出上限。儘管答案仍是錯誤的,但從錯誤的答案中可看出,DeepSeek-V3 在給出最終答案後會進行一定程度的反思,並嘗試修改自己的解題過程,顯示模型在自我修正和推理能力上有所增強。
在文科類問題上,新版 DeepSeek-V3 的回答更全面且有結構性,例如在回答「Bushman 喝不喝牛奶?」時,新版模型提供更詳盡的背景資訊和分析,顯示其在處理複雜問題上的能力提升。舊版 DeepSeek-V3 對此問題的回答僅有三小段話,資訊量有限。
但最重要的是,新版 DeepSeek-V3 能力接近 Claude 3.7 Sonnet 的模型,卻無限制免費提供,讓經常被 Claude 封號的網友們感動到想哭,而且 Claud 每月 20 美元的價格,讓不少 X 網友表示這相當於「白送法拉利」。
不過,在性能封神的同時,使用者卻吐槽模型「變機械了」。實測多輪對話中,V3-0324 能嚴謹關聯量子計算、Python 優化等複雜問題,但回復風格理性到「冰冷」,連表情包都懶得加。
隨著 DeepSeek-V3 的發布,使用者不禁開始遐想未來的版本更新,有網友預測指出,按照此前的節奏,DeepSeek-R2 很有可能在未來幾周就上線。
專家認為,如果 DeepSeek-R2 能延續 R1 的發展路線,但它很可能會直接單挑 OpenAI 捂著的大炸彈 GPT-5,這就讓 OpenAI 靠著封閉生態和雄厚資金支持帶來的壟斷被徹底打破。
值得一提的是,DeepSeek V3 另一大亮點在於採用 MIT 開源協定,上個版本還是自定義許可證,這不僅可以自由修改、分發模型,還支援模型蒸餾、商業化應用。
遺憾的是,DeepSeek 尚未公佈新版模型的系統卡,暫時無法窺探更多技術細節。
- 揭開電動車投資價值,生活財富雙豐收!
- 掌握全球財經資訊點我下載APP
延伸閱讀
上一篇
下一篇