美股

騰訊混元T1正式發布比DeepSeek-R1更快速、幻覺少還便宜3/4！

鉅亨網新聞中心2025-03-22 06:16

騰訊為與國際接軌，挑在周五 (21 日) 深夜正式發表了混元大模型系列的深度思考模型－混元 T1 正式版，為騰訊自研的強推理模型，吐字速度達到 60~80token/s，實際生成效果顯著優於 DeepSeek-R1。

cover image of news article — (圖片來源：騰訊官網)

混元 T1 的前身是今年 2 月中旬在騰訊元寶 APP 上線的混元 T1-Preview 推理模型，而此次正式版則基於騰訊混元 3 月初發布的業界首個超大規模 Hybrid-Transformer-Mamba MoE 大模型 TurboS 快思考基座。

‌

此創新設計的最大優勢在於，它顯著降低了運算複雜度和快取佔用，同時提升了處理長序列和複雜上下文的能力，從而有效應對大規模強化學習訓練的挑戰，提升系統的整體效率和吞吐量，使得模型在思考和生成答案的速度上更為迅猛。

T1 透過大規模後訓練擴展推理能力，並進一步對齊人類偏好，標誌著工業界首次將混合 Mamba 架構無損應用於超大型推理模型。測試結果顯示，T1 在多個公開資料集上的表現與 R1 基本持平或略超，包括在 MMLU-pro、CEval、AIME、Zebra Logic 等中英文知識和競賽級數學、邏輯推理指標上。

目前，T1 已在騰訊雲官網上線，輸入價格為每百萬 tokens 1 元，輸出價格為每百萬 tokens 4 元，相較於 DeepSeek 標準時段的 1/4，具有明顯的價格優勢。使用者可透過體驗位址和 Hugging Face、GitHub 等平台取得此模式的更多資訊。

在各類應用場景中，T1 展現強大的生成能力。在知識問答場景中，T1 與 DeepSeek 的生成效果相近，但生成速度明顯更快。在理科數學推理和複雜指令跟隨能力的測驗中，T1 也表現出色，能夠準確分析提示詞的特點並給出正確答案。此外，T1 也具備長文總結摘要的能力，能夠提煉出文章中的關鍵內容。

舉例來說，演示者出上聯「深深淺水溪流水」，T1 在思考後給出下聯「洋洋灑灑江河滿」(雖然不是最工整的對子，卻已相當出色)。

混元 T1 的技術架構沿用了混元 Turbo S 的創新設計，採用 Hybrid-Mamba-Transformer 融合模式，降低傳統 Transformer 架構的運算複雜度，並在長文本推理方面表現出色。模型訓練階段，研究團隊將 96.7% 的算力投入強化學習訓練，提升了模型的推理能力和對齊人類偏好的最佳化。

為了進一步增強模型的通用性，T1 在回答問題的文風上進行了優化，力求在理工科和文科任務中都能游刃有餘。團隊成員表示，T1 在解決幻覺問題上也進行重點優化，摘要幻覺率顯著低於行業水平，成為一大亮點。

隨著騰訊 (0700-HK) 混元模型系列的快速迭代，騰訊正在探索新的研究方向，致力於降低大模型的幻覺和訓練成本，為未來的 AI 應用帶來更多可能性，同時也為未來非 Transformer 模式的出現鋪路。

騰訊自信地宣布，T1 的性能已達到超一流水平，僅次於 OpenAI 的 o1。為了展現 T1 的強大效能，騰訊也提供了體驗地址，讓使用者進行實際測試。

體驗地址：https://llm.hunyuan.tencent.com/#/chat/hy-t1

‌