《華爾街日報》週五(27日)報導,AI晶片龍頭輝達計劃推出一款專為AI推論運算設計的新處理器,目標協助OpenAI等客戶打造更快速、更高效率的工具,外界認為此舉可能重塑AI運算市場版圖,將於下月在聖荷西舉行的GTC開發者大會亮相。輝達(NVDA-US)正醞釀新一輪產品布局。知情人士透露,輝達正在開發一套全新的推論運算系統,所謂推論是指讓AI模型即時回應使用者查詢的運算流程。新平台預計將於下月在聖荷西舉行的GTC開發者大會亮相,並可能整合新創Groq設計的晶片技術。隨著AI應用從模型訓練逐步轉向實際部署與即時回應,推論運算已成為產業競爭焦點。Google與Amazon近年均推出自研晶片與輝達旗艦產品競爭,加上自動化程式開發快速興起,也推升市場對高效率推論晶片的需求。消息指出,OpenAI已同意成為新處理器的重要客戶之一。作為輝達長期大客戶,OpenAI近月積極尋找更具效率的替代方案,上月更與其他晶片新創簽署合作,顯示其在算力供應上的策略更趨多元。OpenAI週五稍早宣布,將向輝達採購大規模「專用推論算力」,同時也與亞馬遜(AMZN-US)簽署協議採用Trainium晶片,反映大型AI業者正同步分散供應來源。長期以來,輝達憑藉GPU在AI訓練領域建立近九成市占的主導地位,其Hopper、Blackwell與Rubin系列仍被視為業界標竿。不過,隨著企業加速部署AI代理(AgenticAI),市場需求正由訓練轉向推論,部分客戶認為GPU成本與耗能偏高,未必最適合大規模實際運行。在此趨勢下,市場對更低成本、更節能的推論晶片需求明顯升溫。OpenAI上月即與Cerebras簽署數十億美元合作案,該公司主打其推論晶片速度優於傳統GPU,顯示輝達正面臨新一波競爭壓力。報導也指出,輝達去年底同意斥資約200億美元取得Groq關鍵技術授權並延攬其核心團隊,包括創辦人JonathanRoss。Groq採用不同於GPU的語言處理單元(LPU)架構,在推論任務上具備高效率優勢,外界關注輝達後續整合策略。此外,輝達近期亦展現更彈性的產品思維。本月公司宣布擴大與MetaPlatforms(META-US)合作,首次出現大規模僅採用CPU的部署,用於支援Meta廣告AI代理,被視為輝達試圖突破GPU框架、全面卡位AI運算市場的重要訊號。