menu-icon
anue logo
熱門時事鉅亨號鉅亨買幣
search icon

美股

騰訊混元T1正式發布 比DeepSeek-R1更快速、幻覺少 還便宜3/4!

鉅亨網新聞中心 2025-03-22 06:16

cover image of news article
(圖片來源:騰訊官網)

騰訊為與國際接軌,挑在周五 (21 日) 深夜正式發表了混元大模型系列的深度思考模型-混元 T1 正式版,為騰訊自研的強推理模型,吐字速度達到 60~80token/s,實際生成效果顯著優於 DeepSeek-R1。

混元 T1 的前身是今年 2 月中旬在騰訊元寶 APP 上線的混元 T1-Preview 推理模型,而此次正式版則基於騰訊混元 3 月初發布的業界首個超大規模 Hybrid-Transformer-Mamba MoE 大模型 TurboS 快思考基座。


此創新設計的最大優勢在於,它顯著降低了運算複雜度和快取佔用,同時提升了處理長序列和複雜上下文的能力,從而有效應對大規模強化學習訓練的挑戰,提升系統的整體效率和吞吐量,使得模型在思考和生成答案的速度上更為迅猛。

T1 透過大規模後訓練擴展推理能力,並進一步對齊人類偏好,標誌著工業界首次將混合 Mamba 架構無損應用於超大型推理模型。測試結果顯示,T1 在多個公開資料集上的表現與 R1 基本持平或略超,包括在 MMLU-pro、CEval、AIME、Zebra Logic 等中英文知識和競賽級數學、邏輯推理指標上。

目前,T1 已在騰訊雲官網上線,輸入價格為每百萬 tokens 1 元,輸出價格為每百萬 tokens 4 元,相較於 DeepSeek 標準時段的 1/4,具有明顯的價格優勢。使用者可透過體驗位址和 Hugging Face、GitHub 等平台取得此模式的更多資訊。

在各類應用場景中,T1 展現強大的生成能力。在知識問答場景中,T1 與 DeepSeek 的生成效果相近,但生成速度明顯更快。在理科數學推理和複雜指令跟隨能力的測驗中,T1 也表現出色,能夠準確分析提示詞的特點並給出正確答案。此外,T1 也具備長文總結摘要的能力,能夠提煉出文章中的關鍵內容。

舉例來說,演示者出上聯「深深淺水溪流水」,T1 在思考後給出下聯「洋洋灑灑江河滿」(雖然不是最工整的對子,卻已相當出色)。

混元 T1 的技術架構沿用了混元 Turbo S 的創新設計,採用 Hybrid-Mamba-Transformer 融合模式,降低傳統 Transformer 架構的運算複雜度,並在長文本推理方面表現出色。模型訓練階段,研究團隊將 96.7% 的算力投入強化學習訓練,提升了模型的推理能力和對齊人類偏好的最佳化。

為了進一步增強模型的通用性,T1 在回答問題的文風上進行了優化,力求在理工科和文科任務中都能游刃有餘。團隊成員表示,T1 在解決幻覺問題上也進行重點優化,摘要幻覺率顯著低於行業水平,成為一大亮點。

隨著騰訊 (0700-HK) 混元模型系列的快速迭代,騰訊正在探索新的研究方向,致力於降低大模型的幻覺和訓練成本,為未來的 AI 應用帶來更多可能性,同時也為未來非 Transformer 模式的出現鋪路。

騰訊自信地宣布,T1 的性能已達到超一流水平,僅次於 OpenAI 的 o1。為了展現 T1 的強大效能,騰訊也提供了體驗地址,讓使用者進行實際測試。

體驗地址:https://llm.hunyuan.tencent.com/#/chat/hy-t1

文章標籤


Empty