‌

AI推理

‌

‌
‌

‌

2026-02-03

02-03美股雷達
表面好戰友？AI推理崛起讓OpenAI、輝達悄然變質
隨著人工智慧發展重心從模型「訓練」轉向「推理」，科技巨頭 OpenAI 與晶片霸主輝達 (NVDA-US) （NVIDIA）之間的關係正悄然發生變化。儘管輝達的 GPU 在大規模數據訓練領域擁有絕對主導地位，但在處理 AI 模型回應請求的「推理」階段，其硬體架構依賴外部記憶體的特性導致效能面臨瓶頸，這在 OpenAI 旗下對響應速度有極高要求的編碼產品 Codex 中尤為明顯。
‌
‌
‌
‌
‌

2026-01-28

01-28歐亞股
性價比之王！融資30億人民幣後 AI推理GPU公司曦望發布「啟望S3」單位推理成本大砍90%
中國杭州 GPU 新創公司曦望周二 (27 日) 發表新一代推理 GPU 晶片「啟望 S3」，同步推出面向大模型推理的「寰望 SC3-256」超節點方案，並啟動「百萬 Token 一分錢」推理成本計畫。這是曦望近一年完成約 30 億元戰略融資後的首次集中亮相。
‌
‌
‌
‌
‌

2026-01-26

01-26國際政經
別再只看GPU跟HBM！小摩：NAND週期更長更穩 eSSD是本輪主角首選個股是「它」
全球資本市場緊盯 GPU 與高頻寬記憶體 (HBM) 之際，一個悄然崛起的趨勢正改寫半導體的底層邏輯。AI 推理應用浪潮洶湧而來，不僅重塑算力流向，也將長期被視為「強週期商品」的 NAND 快閃記憶體推向舞台中央，使其成為 AI 時代不可或缺的基礎設施資產。
‌
‌
‌
‌
‌

2026-01-05

01-05美股雷達
輝達GB200最貴卻也最省！AI推理成本效益狂勝15倍直接甩開AMD
Signal65 最新報告指出，AI 推理的遊戲規則已徹底改變。決定勝負的關鍵不再是單純的晶片算力或 GPU 數量，而是「每一美元能輸出多少智慧」（Tokenomics）。儘管輝達 (NVDA-US) 的 GB200 NVL72 機架級系統單 GPU 成本約為競爭對手 AMD(AMD-US) MI355X 的兩倍，但在處理前沿混合專家模型（MoE）時，其每 Token 成本卻能實現高達 15 倍的節省優勢，鞏固了輝達在 AI 基礎設施領域的王者地位。
‌
‌
‌
‌
‌

2025-09-17

09-17美股雷達
2030年AI推理引爆上兆美元藍海！Bernstein：蘋果、戴爾成最大贏家現在布局這些也穩賺
華爾街知名投資機構 Bernstein 周二 (16 日) 發布最新研究報告，深入剖析 AI 技術發展趨勢及其帶來的深遠影響。Bernstein 預估，到 2030 年，無比龐大的 AI 推理系統將催生上兆美元等級的「超級藍海」市場，這為聚焦於 IT 硬體與消費電子的大型科技公司帶來長期利多。
‌
‌
‌
‌
‌

2025-08-13

08-13美股雷達
華為憋了一年的AI大招讓推理速度暴增90%的UCM技術是什麼？
中國科技巨擘華為今 (12) 日在 2025 金融 AI 推理應用落地與發展論壇上正式發表 AI 推理創新技術 UCM(推理記憶資料管理器)，並計劃下月正式開源 UCM。什麼是 UCM？解決 AI 回應慢又貴的問題想像一下，當你問 AI 問題時，它需要「思考」很久才回答，而且運算成本很高。
‌
‌
‌
‌
‌

2025-08-12

08-12
有望9月開源！華為正式發布AI推理創新技術UCM 這些晶片股迎來大利多
中國科技巨擘華為今 (12) 日在 2025 金融 AI 推理應用落地與發展論壇上正式發表 AI 推理創新技術 UCM(推理記憶資料管理器)，並打算在下月正式開源 UCM。據了解，作為一款以 KV Cache 為中心的推理加速套件，UCM 融合了多類型緩存加速演算法工具，分級管理推理過程中產生的 KV Cache 記憶數據，可擴大推理上下文窗口，實現高吞吐、低時延的推理體驗，降低每 Token 推理成本。
‌
‌
‌
‌
‌

‌