【AI】阿里千問3成全球最強開源模型,參數量僅DS三分之一
經濟通新聞 2025-04-29 08:33
《經濟通通訊社29日專訊》阿里巴巴(09988-HK)在29日凌晨,開源新一代通義千問模型Qwen3(簡稱千問3),參數量僅為DeepSeek-R1的三分一,成本大幅下降,性能全面超越R1、OpenAI-o1等領先模型,登頂全球最強開源模型。
千問3是國內首個「混合推理模型」,將「快思考」與「慢思考」集成進同一個模型,大大節省算力消耗。
千問3融合了推理與非推理能力,在邏輯分析和創意生成等任務中表現卓越。預訓練數據量達到月36萬億tokens,並通過多輪大規模強化學習與精細優化,在推理、工具調用、指令遵循及多語言能力等方面顯著提升。在工具調用方面表現優異,大幅降低了複雜任務的實現門檻,同時還支持119種語言,覆蓋全球主要語種,滿足多樣化需求。
性能大幅提升的同時,千問3的部署成本還大幅下降,僅需4張H20即可部署千問3滿血版,顯存佔用僅為性能相近模型的三分之一。(ct)
- 貿易戰再起 新興市場債券還能投資嗎?
- 掌握全球財經資訊點我下載APP
文章標籤
上一篇
下一篇