推理
美股雷達
美國晶圓代工廠格芯 (格羅方德 / GlobalFoundries) 近日指出,受惠於 AI 推理與智能體 (Agentic AI) 應用需求爆發,伺服器 CPU 市場正迎來結構性增長的「超級週期」,超微、英特爾與高通被視為主要受惠者。過去以 GPU 為主的 AI 訓練階段,GPU 與 CPU 使用比例約為 8 比 1,而隨著 AI 應用轉向推理與智能體,這一比例已降至 4 比 1,未來甚至可能趨近 1 比 1。
美股雷達
被譽為輝達最強潛在競爭對手的 AI 晶片新創企業 Cerebras Systems,周一 (4 日) 正式宣布啟動 IPO 路演,申請於那斯達克掛牌,股票代號為「CBRS」。Cerebras 打算以每股 115 至 125 美元價格發行 2800 萬股,預計募資 35 億美元,整體最高估值可達 266.2 億美元,較今年 2 月融資時約 230 億美元估值大幅攀升,這將是今年迄今為止全球最大科技 IPO。
美股雷達
在生成式 AI 競爭進入白熱化之際,矽谷新創巨頭 Anthropic 近期與 Google(GOOGL-US) 達成了一項史無前例的合作協議。據報導,Anthropic 已承諾在未來 5 年內向 Google Cloud 支付約 2,000 億美元,用於採購高達 5GW 規模的 Tensor Processing Unit (TPU) 算力及相關雲端服務。
美股雷達
隨著人工智慧(AI)產業重心從訓練轉向推理,CPU 正取代 GPU 成為新的記憶體消耗主力。同時,全球 DRAM 市場供需失衡持續加劇,業界預期此波記憶體超級週期將比原先預期更為持久。隨著 AI 產業的重心由訓練階段轉向推理應用,CPU 逐漸成為記憶體資源的主要消耗來源,進一步加劇全球 DRAM 供應的緊張情況。
A股
DeepSeek 於週四(30 日)發布多模態技術報告《用視覺原語思考》(Thinking with Visual Primitives),詳細揭露其最新識圖模式背後的技術架構。DeepSeek 識圖模式模型參數規模達 2840 億、啟動參數 130 億,基座模型為 DeepSeek-V4-Flash,正式名稱尚未對外公布,權重將於未來整合進 DeepSeek 基礎模型一併發布。
美股雷達
Google(GOOGL-US) 近期發布了新一代自主研究代理——Deep Research 與 Deep Research Max,象徵著 AI 輔助研究領域的一次重大跨越。這兩款工具旨在幫助專業人士從海量數據中提取深度洞察,並自動生成專業級、附有完整引用的研究報告,為金融、生命科學及市場研究等領域提供強大支持。
美股雷達
DeepSeek 最新一代大模型 DeepSeek V4 正式發布,儘管在公開 Benchmark 指標上僅大致追平國際上一代旗艦模型,但其技術報告顯示,該模型在多項底層架構與訓練方法上出現顛覆性突破,正試圖改寫當前大型語言模型發展路徑。綜合近期產業分析與技術報告,DeepSeek V4 不僅在長上下文、後訓練機制與模型穩定性上提出新範式,也反映出全球 AI 競爭正從單純比拼 Benchmark,轉向底層效率與可擴展能力的較量。
A股港股
根據陸媒援引多位知情人士報導,DeepSeek 創辦人梁文鋒已明確指出,新一代旗艦大模型 DeepSeek V4 將於 2026 年 4 月下旬正式亮相。這款備受期待的模型不僅在技術參數上大幅躍進,更因其與國產晶片的深度適配,被視為中國人工智慧產業突破美系硬體依賴的關鍵里程碑。
科技
UniPat AI 近日正式發表了「Echo 預測智能系統」,這是一套針對「未來事件」進行通用預測智能開發的完整基礎設施。據陸媒《鈦媒體》報導,該系統核心模型 EchoZ-1.0 在最新發布的全球通用預測智能榜單 (General AI Prediction Leaderboard) 中,以 Elo 1034.2 的高分榮登榜首,超越了 Google Gemini-3.1-Pro 及 Anthropic Claude-Opus-4.6 等頂尖模型。
科技
在剛落幕的華為中國合作夥伴大會 2026 上,華為正式亮相其全新昇騰 950PR(Ascend 950PR)處理器,並推出搭載該晶片的 AI 訓練與推論加速器 Atlas 350。根據《上海證券報》報導,在大會上,昆侖、華鯤振宇、神州鯤泰、長江計算、寶德、軟通華方及百信等七家華為核心合作夥伴,紛紛推出基於 Atlas 350 的整機產品,使昇騰 950 系列推論算力正式進入商用領域。
美股雷達
美光 (MU-US) 宣布在企業級記憶體領域取得新突破。退出消費級記憶體與固態硬碟 ( SSD ) 市場後,公司將重心轉向資料中心與人工智慧 ( AI ) 應用,並於當地時間 3 月 3 日發表業界首款單一 256GB SOCAMM2 記憶體模組,已開始向客戶出樣與出貨。
A股
在全球生成式人工智慧(AI)競爭加速之際,字節跳動正式宣布旗下「豆包」大模型邁入 2.0 階段,推出面向代理時代的系統性升級版本。官方強調,新版本在整體性能上可對標 GPT-5.2 與 Gemini 3 Pro,同時將推理成本降低約一個數量級,為大規模生產環境下的複雜任務執行提供更具競爭力的解決方案。
科技
Google(GOOGL-US) DeepMind 周四 (12 日) 宣布對其專門化推理模式 Gemini 3 Deep Think 進行重大升級,據官方部落格指出,這次更新象徵著人工智慧在解決現代科學、研究與工程挑戰方面進入了全新維度,不僅在多項頂尖基準測試中刷新世界紀錄 (SOTA),更在實際科研應用中展現出超越人類專家的洞察力。
美股雷達
IBM(IBM-US) 周二 (8 日) 發表全新一代資料中心晶片與伺服器產品「Power11」,主打比競爭對手更節能、並簡化企業導入人工智慧 (AI) 的流程。這是 IBM 自 2020 年以來首次對其 Power 系列進行重大升級。Power 晶片多年來在資料中心領域與英特爾 (INTC-US)、超微 (AMD-US) 競爭,特別是在金融、製造與醫療等專業領域擁有穩定客群。
美股雷達
OpenAI 開源模型將延後發布。OpenAI 執行長奧特曼(Sam Altman)日前在社群平台 X 上宣布,原定於 6 月初夏問世的 OpenAI 開源 AI 模型,將延後至今年夏末才正式推出。Altman 強調,這款「開放 AI 模型」近期在內部研發中出現了「令人意外且驚豔的進展」,雖然還需更多時間完善,但成果「非常值得等待」。
美股雷達
OpenAI 於週二(10 日)正式推出最新 AI 模型 「o3-pro」,並宣稱這是他們目前為止最強大的推理 AI 模型,超越 o1-pro、Gemini 2.5 Pro 與 Claude 4 Opus。o3-pro 是先前已發布的 o3 推理模型的升級版本,具備更精準的邏輯思考能力,特別適用於物理、數學與程式設計等嚴謹的應用領域。
美股雷達
蘋果近期發表一項具指標性的 AI 研究報告,震撼揭露目前市場上號稱具備「推理能力」的 AI 模型,如 Claude Thinking、DeepSeek-R1、o3-mini,實際上只是進行「進階記憶遊戲」,根本談不上真正的邏輯推理。為了避開常見的訓練資料污染問題,蘋果研究團隊自訂了一組從未出現在資料集中的 邏輯謎題,用來測試 AI 模型是否具備真正的 理解與推理能力。
美股雷達
外界懷疑,中國人工智慧(AI)實驗室 DeepSeek 未經授權使用 Google (GOOGL-US) Gemini 系列模型的輸出內容作為訓練依據。DeepSeek 於上週正式推出升級版推理模型 R1-0528,在多項數學與程式碼基準測試中展現優異效能。
美股雷達
科技界對 DeepSeek 即將推出的 R2 模型充滿期待。然而,迄今為該模型的神秘面紗仍未揭開。 DeepSeek 周三 (28 日) 突然宣布其 R1 車型已完成小版試升級,並將其權重上傳至 HuggingFace。使用者可前往官方網頁、APP 及小程式進行測試,API 介面及使用方式維持不變。