V3
科技
中國 AI 獨角獸企業 DeepSeek 團隊周三 (14 日) 發布具有里程碑意義的論文,揭示其最新大模型 DeepSeek-V3 的核心技術革新,創辦人兼執行長梁文鋒也是署名作者之一。該模型在硬體架構和模型設計方面的關鍵創新,為實現具有成本效益的大規模訓練和推理提供思路。
科技
DeepSeek 周一 (24 日) 晚上悄悄推出最新的 DeepSeek-V3-0324 模型,雖非外界預期的 R2 模型,但仍然有不少亮點,從網友實測後的反應來看,升級後的 V3 編碼能力已經接近 Claude3.7,數學能力也有提升,能像推理模型一樣能夠解題。
科技
中國 AI 新創公司 DeepSeek 近來「開源」一波波,上周六 (1 日) 又有更大驚喜,全面揭秘 DeepSeek-V3/R1 推理系统,不僅公開其推理系統的核心優化方案,更首次披露成本獲利率等關鍵數據,引發產業震動。DeepSeek 上周六在知乎平台發佈首條文章,公佈模型推理成本利潤細節,並披露成本獲利率關鍵資訊,若所有 tokens 全按 DeepSeek-R1 的定價計算,理論上一天的總收入為 56 萬 2027 美元,成本獲利率為 545%,這一數字刷新全球 AI 大模型領域的獲利天花板。
2025-05-16
2025-03-25
2025-03-03