參數
小米 (01810-HK) 今 (30) 日發布首個為推理而生的大模型「MiMo」,其中強化學習訓練的 MiMo-7B-RL 模型在數學推理 (AIME 24-25) 和代碼競賽 (LiveCodeBench v5) 測評中,僅用 7B 的參數規模,超越 OpenAI 的 o1-mini 和阿里 Qwen 更大規模的開源推理模型 QwQ-32B-Preview。
A股港股
阿里巴巴 (09988-HK)(BABA-US) 集團宣布推出新一代大模型 Qwen3 系列,涵蓋 6 億至 2350 億參數規模,成為目前中國參數規模最大的開源模式之一。模型採用混合專家(MoE)架構,在多項基準測試中表現突出,引發產業關注。
阿里巴巴 (09988-HK)(BABA-US)Qwen 團隊周三 (5 日) 晚間發文宣佈最新研究成果 QwQ-32B 大語言模型,在僅有 DeepSeek-R1 約二十分之一參數量的情況下,用強化學習 (RL) 實現性能上的驚人跨越。Qwen 團隊在部落格文章中提到,他們深入探索 RL 在提升大語言模型智慧方面的巨大潛力,QwQ-32B 的成功發佈,有力地證明 RL 是提升模型性能的強大引擎。
2025-04-30
2025-04-29
2025-03-06