menu-icon
anue logo
鉅亨傳承學院鉅亨號鉅亨買幣
search icon

AI推理





    2026-04-23
  • 美股雷達

    NAND 快閃記憶體龍頭 SanDisk (SNDKV-US) 近日宣布啟動高頻寬快閃記憶體(HBF)原型產線,並規劃於 2027 年實現商業化量產。市場認為,這不只是技術升級,更是 SanDisk 複製 SK 海力士 HBM 成功模式的關鍵一步,意圖從傳統供應商躍升為產業標準制定者,搶占下一個 AI 記憶體時代的主導權。






  • 2026-04-14
  • 港股

    被譽為「Token 第一股」的迅策 (03317-HK)近期港股表現搶眼,周一 (13 日) 股價再度創下歷史新高,單日漲幅達 15.61%,總市值一舉突破 1156 億港元大關。回顧迅策的上市歷程,自 2025 年底登陸港交所以來,短短三個多月內股價累計飆升超過 630%,年內漲幅亦超 609%,展現出強勁的市場爆發力。






  • 2026-02-03
  • 美股雷達

    隨著人工智慧發展重心從模型「訓練」轉向「推理」,科技巨頭 OpenAI 與晶片霸主輝達 (NVDA-US) (NVIDIA)之間的關係正悄然發生變化。儘管輝達的 GPU 在大規模數據訓練領域擁有絕對主導地位,但在處理 AI 模型回應請求的「推理」階段,其硬體架構依賴外部記憶體的特性導致效能面臨瓶頸,這在 OpenAI 旗下對響應速度有極高要求的編碼產品 Codex 中尤為明顯。






  • 2026-01-28
  • 歐亞股

    中國杭州 GPU 新創公司曦望周二 (27 日) 發表新一代推理 GPU 晶片「啟望 S3」,同步推出面向大模型推理的「寰望 SC3-256」超節點方案,並啟動「百萬 Token 一分錢」推理成本計畫。這是曦望近一年完成約 30 億元戰略融資後的首次集中亮相。






  • 2026-01-26
  • 國際政經

    全球資本市場緊盯 GPU 與高頻寬記憶體 (HBM) 之際,一個悄然崛起的趨勢正改寫半導體的底層邏輯。AI 推理應用浪潮洶湧而來,不僅重塑算力流向,也將長期被視為「強週期商品」的 NAND 快閃記憶體推向舞台中央,使其成為 AI 時代不可或缺的基礎設施資產。






  • 2026-01-05
  • 美股雷達

    Signal65 最新報告指出,AI 推理的遊戲規則已徹底改變。決定勝負的關鍵不再是單純的晶片算力或 GPU 數量,而是「每一美元能輸出多少智慧」(Tokenomics)。儘管輝達 (NVDA-US) 的 GB200 NVL72 機架級系統單 GPU 成本約為競爭對手 AMD(AMD-US) MI355X 的兩倍,但在處理前沿混合專家模型(MoE)時,其每 Token 成本卻能實現高達 15 倍的節省優勢,鞏固了輝達在 AI 基礎設施領域的王者地位。






  • 2025-09-17
  • 美股雷達

    華爾街知名投資機構 Bernstein 周二 (16 日) 發布最新研究報告,深入剖析 AI 技術發展趨勢及其帶來的深遠影響。Bernstein 預估,到 2030 年,無比龐大的 AI 推理系統將催生上兆美元等級的「超級藍海」市場,這為聚焦於 IT 硬體與消費電子的大型科技公司帶來長期利多。






  • 2025-08-13
  • 美股雷達

    中國科技巨擘華為今 (12) 日在 2025 金融 AI 推理應用落地與發展論壇上正式發表 AI 推理創新技術 UCM(推理記憶資料管理器),並計劃下月正式開源 UCM。什麼是 UCM?解決 AI 回應慢又貴的問題想像一下,當你問 AI 問題時,它需要「思考」很久才回答,而且運算成本很高。






  • 2025-08-12
  • 中國科技巨擘華為今 (12) 日在 2025 金融 AI 推理應用落地與發展論壇上正式發表 AI 推理創新技術 UCM(推理記憶資料管理器),並打算在下月正式開源 UCM。據了解,作為一款以 KV Cache 為中心的推理加速套件,UCM 融合了多類型緩存加速演算法工具,分級管理推理過程中產生的 KV Cache 記憶數據,可擴大推理上下文窗口,實現高吞吐、低時延的推理體驗,降低每 Token 推理成本。