大語言模型
科技
離開 Meta(META-US)後,AI 權威楊立昆 (Yann LeCun) 對矽谷與美國科技界的批判不再局限技術路線,更深入文化心態層面。近日,楊立昆直指矽谷「太傲慢」,無法想像卓越創意可能來自中國,並警告這種偏見正讓美國在 AI 競賽中變得盲目。
港股
阿里巴巴 (09988-HK)周一 (26 日) 晚間正式發布備受關注的旗艦推理模型「Qwen3-Max-Thinking」,該模型在多項權威評測中創下全球新紀錄,表現媲美 GPT-5.2 與 Gemini 3 Pro,被視為目前中國實力最強、最貼近國際頂尖水準的大語言模型。
國際政經
圖靈獎得主楊立昆(Yann LeCun)再度對當前席捲全球的大語言模型(LLM)發出嚴厲批判,他認為這些模型雖然在文字處理上表現驚人,但其「理解」能力仍是表層、統計性的,缺乏基礎的常識、因果推理及物理世界認知,甚至無法與 4 歲幼童,或如貓狗等動物的智慧相比。
A股港股
2025 年世界工程組織聯合會全體大會暨全球工程大會周一 (13 日) 在上海世博中心開幕。開幕式上,由中國工程院院刊《Engineering》評選的「2025 全球十大工程成就」正式發布,DeepSeek 開源大語言模型、人形機器人、南水北調中線工程等入選。
DeepSeek 在開源周第四天一連更新 DualPipe、EPLB 以及深入分析 V3/R1 模型中計算與通信重疊機制的優化並行策略等三項專案,讓大模型訓練更快,成本更低,還能保持頂尖性能,值得一提的是,DualPipe 是由 Jiashi Li、Chengqi Deng 和梁文峰共同研發。
最新研究顯示,新一輪 AI 熱潮將引發晶片半導體產業波動,今年全球 AI 晶片規模將超過 1500 億美元,2027 年增至 4000 億美元,最保守估計執亦達 1100 億美元。德勤中國日前發表《技術趨勢 2025》報告指出,多達 7 成企業正在極探索或應用大語言模型 (LLM)。