月之暗面核心團隊回應Kimi K2熱點 否認低成本傳聞 隔空調侃OpenAI
鉅亨網新聞中心
月之暗面核心團隊於 11 月 11 日凌晨在社群媒體平台 Reddit 上舉行了「有問必答」(AMA) 活動,共同創辦人兼 CEO 楊植麟、算法團隊負責人周昕宇和共同創辦人吳育昕等人,在最新發布的 Kimi K2 Thinking 模型之後,正面回應了多項業界熱點議題。

針對網絡流傳的 Kimi K2 Thinking 訓練成本僅 460 萬美元的說法,楊植麟予以否認,並表示這並非官方數據,訓練成本難以量化,因其中很大一部分用於研究和實驗。楊植麟同時透露,月之暗面已在研究 K2 的視覺 - 語言 (VL) 版本。
性能與效率的權衡
有不少海外網友提出了十分尖銳的問題,比如 Kimi K2 Thinking 的推理時間過長,以及榜單高分與實際體驗不符等問題。楊植麟解釋稱,現階段該模型優先考慮的是「絕對性能」,而非 token 效率。月之暗面正積極優化 token 使用效率,並將嘗試把效率納入獎勵機制,以便模型能學習如何簡化思考過程。
有網友質疑 Kimi K2 Thinking 的高分是否經過專門訓練,楊植麟回應稱,模型在提升智能體推理能力方面取得了一些進展,使其在 HLE 等測試中得分較高,但月之暗面仍在努力進一步提升其通用能力。
架構創新與未來規劃
月之暗面此前開源了混合線性注意力架構 Kimi Linear,楊植麟稱,KDA 混合線性注意力模塊在所有維度上都展示了性能提升,同時保持了線性注意力的高效性。他並透露,KDA「很可能會以某種形式出現在 K3 中」。當網友詢問 K3 的發布時間時,楊植麟則戲謔地回應道:「在 Sam 價值萬億美元的數據中心建成之前。」
針對上下文窗口的限制,目前 Kimi K2 Thinking 最大支持 256K 的上下文。楊植麟稱,月之暗面應該能在未來的版本中增加上下文長度。周昕宇補充道,團隊先前曾嘗試過 100 萬個 token 的上下文窗口,但當時服務成本過高,未來他們會重新考慮更長的上下文窗口。
開放性與競爭策略
月之暗面團隊似乎也調侃了 OpenAI。周昕宇在回應是否有 AI 瀏覽器開發計劃時,犀利地表示,要做出更好的模型,「並不需要再去套一層新的 Chromium 殼」。當網友好奇 OpenAI 為何要燒掉那麼多錢時,周昕宇則稱:「這個問題只有 Sam 才知道。我們有自己的方式和節奏。」
在開源策略方面,楊植麟強調,開放安全對齊技術棧有助於更多研究者在微調開源模型時保持安全性,同時他強調:「我們擁抱開源,因為我們相信對 AGI(通用人工智能) 的追求,應該帶來團結,而不是分裂。」
針對企業用戶因擔憂「中國大模型」而實施「封禁」的情況,吳育昕表示,雖然被封禁超出控制範圍,但「開源該模型有望成為消除部分顧慮的有效途徑 (企業可以自行部署)」。
此次在 Reddit 平台上的公開問答,集中回應了全球網友對 Kimi 技術細節的大量興趣和疑問,折射出海外開發者對以 Kimi 系列為代表的中國 AI 創新能力的認可。
延伸閱讀
- 軟銀與OpenAI成立合資企業 AI「利潤循環」下再掀戰略與泡沫擔憂
- 微軟成立MAI超級智慧團隊 與OpenAI並行 旨在把人放回中心
- 英特爾執行長親自掌舵AI業務 技術長跳槽OpenAI
- 輝達強力反彈5% 分析師:市場過度擔憂AI泡沫疑慮
- 講座
- 公告
上一篇
下一篇