模型
中國人工智慧 (AI) 新創公司深度求索(DeepSeek)尚未決定旗下下一代大型語言模型 R2 的正式發表時間,原因是執行長梁文峰對模型目前的性能表現仍不滿意。根據《The Information》周四 (26 日) 引述兩位知情人士報導,R2 原計畫於 5 月推出,作為大受歡迎的 R1 推理模型後繼版本,並希望能在程式碼生成與非英語語言推理方面有所突破。
野村證券策略師週三 (25 日) 發布報告指出,在未來一個月左右的時間內,可能有逾 1,000 億美元資金湧入美股,為近年來最大規模潛在流入之一。此舉可能為股市注入短期動能,但亦伴隨未來急跌風險。野村跨資產策略師 Charlie McElligott 在一份報告中表示,其模型預測來自「波動調節基金」(Volatility-control funds) 的資金可能大舉進場。
美股雷達
據《CNBC》周二 (24 日) 報導,美國聯邦法官周一裁定,人工智慧新創 Anthropic 使用版權書籍訓練其 AI 模型 Claude 屬於「合理使用」且具「轉化性質」。此判決對 AI 產業具重大意義。法官認為,大型語言模型並未向公眾重現作品的創意元素,甚至連單一作者可識別的表達風格都沒有。
港股
《CNBC》周二 (17 日) 報導,中國科技巨擘騰訊 (00700-HK) 正積極拓展歐洲雲端事業,並計劃憑藉其在遊戲、影音串流及 WeChat 等領域的多年技術累積,挑戰美國三大超大規模雲端服務商——亞馬遜 (AMZN-US)、微軟 (MSFT-US) 與 Google(GOOGL-US),這三家公司目前合計掌握歐洲約七成雲端市占。
科技
面對愈演愈烈的人工智慧(AI)價格戰,OpenAI 日前宣布其最新 o3 系列模型全面降價,最高降幅達 80%。原本每百萬字符(tokens)定價為 10 美元(o3)與 40 美元(o3-pro),如今分別僅需 2 美元與 8 美元,大幅削弱市場對手的競爭力。
美股雷達
OpenAI 於週二(10 日)正式推出最新 AI 模型 「o3-pro」,並宣稱這是他們目前為止最強大的推理 AI 模型,超越 o1-pro、Gemini 2.5 Pro 與 Claude 4 Opus。o3-pro 是先前已發布的 o3 推理模型的升級版本,具備更精準的邏輯思考能力,特別適用於物理、數學與程式設計等嚴謹的應用領域。
科技
美國史丹佛大學以人為本 AI 研究院今年 4 月發布第 8 份年度《AI 指數報告》,這份 456 頁的權威報告全面追蹤 2024 年全球 AI 發展脈絡,涵蓋技術研發、經濟影響、政策治理、公眾認知等八大方面,揭示 AI 正以「超預期速度」滲透人類社會。
根據《彭博》周四 (29 日) 報導,中國人工智慧 (AI) 新創公司深度求索 (DeepSeek) 宣布,其升級版模型 DeepSeek-R1-0528 在數學、程式設計與邏輯推理方面表現優於先前版本,並顯著降低模型幻覺 (Hallucination) 現象。
科技
亞馬遜 (AMZN-US) 與 Alphabet(GOOGL-US)投資的人工智慧 (AI) 新創公司 Anthropic 周四 (22 日) 正式發布旗下迄今最強的 AI 模型 Claude Opus 4 與 Claude Sonnet 4,號稱可執行長達 7 小時的程式撰寫與複雜任務,為 AI 代理人與開發者提供更高效的解決方案,也為業界樹立新標準。
A股
中國搜尋引擎巨擘百度 (BIDU-US)(09888-HK) 周三 (21 日) 公布 2025 會計年度第一季 (截至 3/31) 財報,儘管核心廣告業務仍承壓,但受惠於人工智慧 (AI) 雲端服務需求提升,總營收優於市場預期,帶動美股盤前股價一度上漲逾 2%。
美股雷達
《彭博》周二 (20 日) 援引知情人士消息報導,蘋果 (AAPL-US) 計劃在下月登場的全球開發者大會 (WWDC) 上宣布,開放自家人工智慧 (AI) 模型給第三方開發者使用,藉此促進 AI 應用程式的誕生,並進一步鞏固其在生成式 AI 領域的布局。
美股雷達
微軟 (MSFT-US) 周一 (19 日) 在年度開發者大會「Build」上宣布,將擴大其雲端人工智慧 (AI) 生態系,正式引入馬斯克旗下 xAI 的 Grok 3 和 Grok 3 mini 模型,並攜手法國新創 Mistral 及德國新創 Black Forest Labs,讓 Azure 雲端用戶可選擇超過 1,900 種 AI 模型。
台股新聞
聯發科 (2454-TW) 總經理暨營運長陳冠州出席台積電 (2330-TW)(TSM-US) 技術論壇時指出,AI 邊緣裝置的算力預計每兩年成長一倍,生成式 AI 手機的滲透率將在 2029 年超過 50%,也就是屆時每兩支手機就有一支具備 AI 能力,其中不僅 CPU、GPU 性能提升,NPU(神經網路處理器) 算力也將顯著提升。
美股雷達
華爾街主要美股預測機構在 2025 年接連受挫,許多人誤判了川普強硬貿易政策對股市的實際衝擊,因為再高明的模型也無法預測多變的川普。儘管面臨貿易戰升溫與市場劇烈波動,華爾街多數分析師仍堅信標普 500 指數將在 2025 年下半年反彈,但實際上,這種樂觀情緒已與歷史表現背道而馳。
美國史丹佛大學人本人工智慧研究中心 (HAI) 發布一年一度 AI Index 報告,內容長達 456 頁,涵蓋了過去一年全球 AI 各種進展的資訊,其中提到中國與美國模型的差距正在縮小。報告指出,2023 年,領先的美國模型表現明顯優於中國模型,但這項趨勢已不復存在。
美股雷達
根據美媒《The Information》周五 (4 日) 援引知情人是消息報導,Meta Platforms(META-US)計劃於本月發布其最新的語言模型 Llama 4,儘管該模型已經至少兩次推遲。這是 Meta 為在人工智慧 (AI) 競賽中爭奪領先地位所作的努力之一,但報導指出,Meta 可能會再次推遲 Llama 4 的發布。
美股雷達
OpenAI 執行長奧特曼 (Sam Altman) 周一 (3 月 31 日) 表示,公司計劃在未來幾個月內發布自 GPT-2 以來,首款具備推理能力的開放權重 (open-weight) 語言模型。開放權重語言模型的訓練參數 (權重) 將對外開放,開發者可以使用這些參數分析並微調模型,以適應特定任務,而無需取得原始訓練數據。
港股
阿里巴巴 (09988-HK)(BABA-US) 宣布推出一款名為 QwQ-32B 的新型 AI 模型,聲稱其僅需 DeepSeek 模型一小部分的數據,即可達到與之相當的性能,消息一出,激勵公司股價顯著上漲。報導稱,阿里巴巴於 2025 年已憑藉其高基準測試的模型在中國國內 AI 領域嶄露頭角。
A股
路透周二 (25 日) 援引知情人士消息報導,中國人工智慧 (AI) 新創公司深度求索 (DeepSeek) 原本計劃在 5 月推出新一代 AI 模型「R2」,但現在該公司希望盡快推出。據了解,新模型在寫程式和多語言推理方面的能力有所提升。DeepSeek 的成功可能會徹底改變 AI 行業。
A股港股
DeepSeek 開源第二天,他們一大早在官推上發佈消息,開源 DeepEP。DeepEP 是一個專為混合專家 (MoE) 模型訓練和推理設計的開源 EP(專家並行) 通訊庫。此舉迅速在 AI 社群引起廣泛關注,不到一小時,DeepEP 在 GitHub 上的 Star 數就已破千。