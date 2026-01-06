鉅亨網記者魏志豪 台北 2026-01-06 17:11

隨著 AI 推論需求暴增，記憶體儲存模式改變，輝達 (NVDA-US) 今 (6) 日也發表最新一代推論平台 NVIDIA BlueField-4 資料處理器，驅動推論情境記憶儲存平台 (NVIDIA Inference Context Memory Storage Platform)，為全新一代 AI 原生儲存基礎架構，預計將在下半年上市。

輝達搶AI推論市場 推新一代AI原生儲存架構BlueField-4。(圖：業者提供)

包括營邦 (3693-TW)、Cloudian、DDN、戴爾科技集團、慧與科技、Hitachi Vantara、IBM、Nutanix、Pure Storage、Supermicro、VAST Data 與 WEKA 等創新的儲存公司，率先利用 BlueField-4 打造新一代 AI 儲存平台，並將於 2026 年下半年上市。

輝達指出，隨著 AI 模型擴展至數兆個參數與多步驟推理，產生大量情境資料，以鍵值 (KV) 快取表示，對準確性、使用者體驗與連續性至關重要。KV 快取無法長期儲存在 GPU 上，因為這會對多代理系統中的即時推論造成瓶頸。AI 原生應用需要全新類型的可擴充基礎架構，以儲存並分享這些資料。

輝達推論情境記憶儲存平台可擴展 GPU 記憶容量，實現節點間高速共享，將每秒處理的詞元數量提升多達 5 倍；相較於傳統儲存裝置，提供高達 5 倍的能源效率，可提供情境記憶體的基礎架構。

輝達創辦人暨執行長黃仁勳表示，AI 正在徹底革新整個運算堆疊，而現在輪到儲存空間。AI 不再僅是一次性使用的聊天機器人，而是智慧協作夥伴，能夠理解物理世界、進行長期推理、以事實為基礎、使用工具完成實際工作，並保留短期與長期記憶。透過 BlueField-4，NVIDIA 與軟硬體合作夥伴，正重新改造儲存堆疊，迎向 AI 的下一個前沿。

NVIDIA 推論情境記憶儲存平台可提升 KV 快取容量，並加速機架級 AI 系統叢集間的情境共享，同時多回合 AI 代理的持續情境可改善回應能力、提高 AI 工廠輸送量，並支援長情境、多代理推論的有效擴展。

NVIDIA BlueField-4 平台的主要功能包括，Rubin 叢集級 KV 快取容量，可提供長情境、多回合代理推論所需的規模與效率；相較於傳統儲存裝置，可將能源效率提升高達 5 倍。

此外，透過 NVIDIA DOCA 框架，可在 AI 節點間智慧加速 KV 快取共享，並與 NVIDIA NIXL 函式庫和 NVIDIA Dynamo 軟體緊密整合，可最大化每秒的詞元生成量、縮短首次生成詞元的時間，並改善多回合回應能力。