API成本不到DeepSeek一半!騰訊推快思考模型混元Turbo S:比大模型界的拼多多還便宜
鉅亨網編譯陳韋廷 2025-03-03 08:40

各家大模型紛紛推出深度思考模型之際,中國互聯網大廠騰訊 (00700-HK) 上周四 (2 月 27 日)「反常」地推出快思考模型 Turbo S,並在騰訊雲和元寶上線。
目前,開發者和企業用戶可在騰訊雲上通過 API 調用騰訊混元 Turbo S,免費試用一周,開發團隊稱「比大模型界的拼多多還便宜」。
有別於 Deepseek R1、騰訊混元 T1 等必須「想一下」再回復的慢思考模型,混元 Turbo S 能實現「秒回」,吐字速度提升一倍,首字時延降低 44%,
同時,Turbo S 在知識、數理、創作等方面也有突出表現,透過模型架構創新,Turbo S 部署成本也大幅下降,持續推動大模型應用門檻降低。
在業界通用的多個公開標準,Turbo S 在知識、數學、推理等多個領域展現出對標 DeepSeek V3、GPT 4o、Claude3.5 等業界領先模型的效果表現。
架構方面,透過創新性地採用 Hybrid-Mamba-Transformer 融合模式,混元 Turbo S 有效降低傳統 Transformer 結構的計算複雜度,減少 KV-Cache 緩存佔用,實現訓練和推理成本的下降。
Mamba 是一種狀態空間模型 (SSM),專為高效處理長序列而設計,在記憶體使用上比 Transformer 更為節省。
Turbo S 首次將 Mamba 應用於超大規模 MoE(專家混合模型),在保持精度的同時充分利用 Mamba 高效性,同時也保留 Transformer 在推理任務中的優勢。這一突破不僅降低了訓練和推理成本,還提升了速度和智能水準。
透過長短思維鏈融合,騰訊混元 Turbo S 在保持文科類問題快思考體驗的同時,基於自研混元 T1 慢思考模型合成的長思維鏈數據,顯著提升理科推理能力,實現模型整體效果提升。
作為旗艦模型,Turbo S 未來將成為騰訊混元系列衍生模型的核心基座,為推理、長文、代碼等衍生模型提供基礎能力。
定價方面,Turbo S 輸入價格為人民幣 0.8 元 / 百萬 tokens,輸出價格 2 元 / 百萬 tokens,相比前代混元 Turbo 模型價格下降數倍,是 deepseek API 成本的約一半至四分之一, 另外,混元滿血 T1 將在 3 月初發布。
- 最新遺產稅怎麼算?傳承必知重點有哪些?
- 掌握全球財經資訊點我下載APP
延伸閱讀
上一篇
下一篇