AI模型
美股雷達
《CNBC》周二 (2 日) 報導,亞馬遜推出 Nova Forge 服務,讓企業客戶在 AI 模型訓練早期就能加入自有數據進行深度客製化,年費 10 萬美元。相較企業自建模型動輒數億美元成本,亞馬遜稱此方案更具經濟效益。目前企業已能在大型語言模型訓練完成後進行微調,但 Nova Forge 會更依賴客戶提供的數據。
科技
在太平洋彼岸工程師們準備切火雞慶祝感恩節時,DeepSeek 周四 (27 日) 晚間悄然上線 DeepSeekMath-V2,此舉如同在 AI 領域投下一顆重磅炸彈,引發了廣泛關注。DeepSeekMath - V2 在數學競賽領域展現了驚人實力,在 IMO 2025 和 CMO(中國數學奧林匹克)2024 中都達到了金牌水準,在北美最頂尖、最負盛名的大學本科生數學競賽普特南 (Putnam)2024 競賽中更拿下 118 分,只差滿分 120 兩分的成績。
A股港股
阿里巴巴集團 (09988-HK) 最新財報顯示,雲端業務營收年增 34%,成為拉動整體成長的主要引擎。與此同時,阿里旗下大模型應用「千問 App」(Qwen App)公測首周下載量突破 1000 萬次,顯示出強勁的市場採用率。在 GPU 資源已滿載運行、且宣布未來三年 AI 相關投資將擴大至超過 3,800 億元的背景下,阿里巴巴的 AI 戰略核心浮出水面。
科技
Anthropic 周一 (24 日) 發布其頂級大型語言模型 Claude Opus 4.5。該模型在程式設計、系統級任務和複雜推理方面樹立了新的行業標竿,並同步帶來全面升級的工具鏈、應用整合,以及卓越的執行效率,旨在為全球開發者和企業用戶提供「更聰明、更省心」的 AI 解決方案。
美股雷達
根據《彭博》周三 (19 日) 報導,Google 母公司 Alphabet(GOOGL-US) 股價盤中一度大漲 6.9%,再度刷新歷史新高,主要受惠於新版 Gemini AI 模型獲得市場高度評價。分析師認為 Gemini 3 表現優於 OpenAI 的 GPT-5,加上巴菲特旗下波克夏上周披露已建立持股,為股價注入強勁動能。
美股雷達
谷歌 (GOOGL-US) 正式發布最新一代推理模型 Gemini 3.0 Pro,並同步開放 API 介面及在 谷歌 AI Studio 推出預覽版。這款模型一經發布,即刻橫掃各大評測榜單,以「一夜封神」的姿態震撼了全球 AI 社群。值得玩味的是,OpenAI 執行長奧特曼也隔空向谷歌發來「賀電」,在社群媒體上評價「Gemini 3 看起來很不錯」,谷歌執行長皮查伊(Sundar Pichai)則以一個輕鬆的表情包回應,盡顯王者風範。
美股雷達
輝達 (NVDA-US) 在機器人學習大會(Conference on Robot Learning, CoRL)上發布了一系列重量級的開源技術,為全球機器人研發社群帶來了前所未有的「全方位解決方案」(Full-Stack Package)。
美股雷達
綜合外媒周一 (29 日) 報導,中國 AI 新創公司 DeepSeek 發布實驗性新模型 V3.2-Exp,新模型採用創新的「稀疏注意力」機制,可降低運算成本並提升長文本處理能力,同時 API 價格調降超過 50%。V3.2-Exp 模型採用 DeepSeek 稀疏注意力 (DeepSeek Sparse Attention, DSA) 機制,該公司表示這項技術能削減運算成本,並提升某些類型的模型效能。
科技
OpenAI 發布了一項新的基準測試,用於比較其 AI 模型與各行業專業人士的工作表現,結果顯示,GPT-5 模型以及競爭對手 Anthropic 的 Claude Opus 4.1「已經接近行業專家的工作品質」。這項名為 GDPval 的全新基準測試,設計理念根植於美國 GDP 貢獻最大的九大產業,涵蓋了從醫療、金融、製造業到政府部門等廣泛領域。
A股港股
阿里雲近期一次性發布三款多模態人工智慧大模型,引發業界高度關注。這三款模型分別是:業界首個原生端到端全模態 AI 模型 Qwen3-Omni、大幅升級的開源圖像編輯模型 Qwen-Image-Edit-2509,以及主打高品質語音合成的收費模型 Qwen3-TTS-Flash。
美股雷達
阿布達比科技創新研究院 (TII) 與輝達周一 (22 日) 宣佈,在阿拉伯聯合大公國成立一個專注於開發下一代 AI 模型和機器人平台的聯合研究實驗室。該實驗室是輝達在中東地區首個 AI 技術中心,結合 TII 的多學科研究能力與輝達的 AI 模型及計算能力,推動全球 AI 的快速發展。
科技
美國國家經濟研究局(NBER)發布一篇由 OpenAI 提交的工作論文,這份使用 150 萬次對話、迄今為止最大規模數據的分析報告,展現這三年來人類如何使用 ChatGPT。這份由 OpenAI 首席經濟學家艾倫 · 夏特吉(Aaron Chatterji)與哈佛大學經濟學家戴維 · 戴明合作的研究,追蹤了自 2022 年推出以來,使用者如何與 ChatGPT 互動。
科技
阿里巴巴通義實驗室發表新一代基礎模型架構 Qwen3-Next,並基於此架構訓練出 Qwen3-Next-80B-A3B-Base 模型。這款新模型擁有高達 800 億個參數,但僅需啟動其中 30 億個參數,實現了效能與成本的最佳平衡,為大模型發展樹立新標竿。
美股雷達
微軟 (MSFT-US) 計劃擴大用於訓練自家人工智慧(AI)模型的算力基礎設施,希望能與 OpenAI、Anthropic 等對手一較高下。微軟消費者 AI 業務負責人 Mustafa Suleyman 周四 (11 日) 在全體會議上告訴員工,公司將對自有算力集群進行「重大投資」,用於模型訓練。
雜誌《商業內幕》引述消息人士報導,Meta 平台 (META-US) 正加速開發其下一代 AI 模型,力拚在今年底前推出 Llama 4.X。分析師看好 Meta 股價將從目前的 751.11 美元再平均上漲 13.03%。報導稱,Meta 超級智慧實驗室(MSL)內部一個名為「TBD」的團隊,正在全力開發 Llama 4.X,目標是確保模型能在年底前達到可投入生產的狀態。
美股雷達
根據《CNBC》周四 (28 日) 報導,微軟 (MSFT-US) 同日宣布開始測試自主開發的 MAI-1-preview AI 模型,試圖減少對 OpenAI 技術的依賴,這是該公司首個端到端自主訓練的基礎模型。微軟周四宣布,MAI-1-preview AI 模型,可能用於增強消費者版 Copilot 助理功能。
美股雷達
摩根大通最新報告顯示,OpenAI 雖佔據 AI 核心模型網站 78% 流量,但分析師認為其創新策略構成的護城河日趨脆弱。隨著競爭對手追趕,模型商品化風險升高,OpenAI 須轉型為更專注產品、多元化的組織以維持領導地位。據《財星》周一 (18 日) 報導,摩根大通 (JPM-US) 最新 40 頁報告顯示,作為 ChatGPT 創造者的 OpenAI,吸引了 AI 核心模型網站 78% 的日活躍用戶,其餘六家競爭對手瓜分剩餘市場。
馬斯克旗下 xAI 最新語言大模型 Grok 4 現在開始對所有用戶免費開放。免費用戶每天可完成少量查詢,超過限制則需訂閱。根據 xAI 官方 X 帳號的介紹,只需使用「自動」模式,Grok 就會將複雜的查詢路由到 Grok 4。若使用者偏好「掌控一切」,則可以切換到「專家」模式。
美股雷達
OpenAI 宣布眾所期待的 GPT-5 將於 8 日凌晨 1 點發布,目前預期共會推出三個版本。此外,OpenAI 也表示,未來一年將以 1 美元的價格向美國聯邦機構提供其 ChatGPT Enterprise 產品。根據 OpenAI 官網最新流出的圖示,OpenAI 此次可能會帶來 GPT-5、GPT-5 mini 和 GPT-5 nano 三個版本,這點和之前的 GPT-4.1 相同。
美股雷達
OpenAI 周二 (5 日) 正式發布兩款免費試用的開放權重語言模型:gpt-oss-120b 和 gpt-oss-20b。這是 OpenAI 自 2019 年推出 GPT-2 以來,六年來首次發布開放權重模型,同時也是其與微軟簽署獨家雲端服務協議後,首批問世的此類模型,代表 OpenAI 在 AI 戰略上邁出了重要一步。