menu-icon
anue logo
鉅亨傳承學院鉅亨號鉅亨買幣
search icon

台股
美股
科技
🔥

【熱門時事】Google TurboQuant 橫空出世! 連日血洗記憶體族群

時事上線時間

2026-03-27 16:32:51

Google  3/24一篇論文,直接讓儲存巨頭們「集體失眠」,一夜市值蒸發幾百億!最新部落格官宣TurboQuant演算法,直接將快取壓到3-bit,記憶體佔用只有1/6。

眾所周知,大模型跑起來時,KV快取(KV cache)簡直是記憶體界的「吞金獸」。為了不重複計算之前的Token,LLM維持一份「運行記憶」,隨著對話越來越長,這份記憶會像滾雪球一樣迅速膨脹。

Google的TurboQuant,給出了一套極其「暴力」的瘦身方案:

首先,把KV快取裡的高維向量做一次「旋轉」,再換一套極坐標系來描述,記憶體開銷直接歸0。然後,用僅僅1-bit額外空間,放一個數學「校正器」進去,把壓縮帶來的系統性偏差精確抹平。

記憶體佔用暴降6倍,儲存巨頭集體重挫

對於晶片儲存巨頭來說,這無異於一場「底層邏輯大地震」。美光、西數等巨頭的估值基石,向來建立在「AI伺服器單機容量紅利」之上。一旦單次推理任務的位元(Bit)需求發生結構性驟降,高性能儲存的增長動能將直接面臨「縮水」危機。

直白講,GoogleTurboQuant出世,直接衝擊了晶片儲存巨頭們,備受追捧的AI硬體邏輯。KV快取暴降6倍,速度提升8倍,意味著每台伺服器所需的高端記憶體晶片可能變少。

美股記憶體族群週三 (25 日) 拋售潮湧現後,亞股週四 (26 日) 時段,南韓記憶體大廠三星與 SK 海力士股價分別下跌約 5% 與 6%,日本快閃記憶體廠鎧俠亦重挫近 6%。

緊接著,美股記憶體族群週四持續血染,美光 (MU-US) 週四再度跳水 6.97%,收每股 355.46 美元。威騰電子 (WDC-US) 慘跌 7.70%,收每股 273.35 美元。

SanDisk (SNDK-US) 下殺 11.02%,收每股 603.17 美元。希捷科技 (STX-US) 血崩 8.33%,收每股 378.79 美元。

市場解讀,TurboQuant 技術若成功落地商用,可能降低 AI 訓練與推論過程中對高頻寬記憶體 (HBM) 與 DRAM 的需求,進而影響整體產業成長動能。記憶體晶片一直是支撐生成式 AI 發展的關鍵硬體之一,包括 Google、OpenAI 與 Anthropic 等業者均高度依賴。

Google 版 DeepSeek 時刻

Cloudflare 執行長 Matthew Prince 將此技術形容為「Google 版 DeepSeek 時刻」,意指類似中國 AI 公司 DeepSeek 先前透過效率突破引發市場震盪。

他指出,AI 在速度、記憶體使用與能耗方面仍有大量優化空間。

不過,市場亦有不同聲音。部分分析師認為,隨著記憶體瓶頸逐步被突破,AI 模型將能處理更大規模的資料,反而可能推升整體記憶體需求,而非如市場憂慮般下降。

Kiwoom Securities 研究員 Han Ji-young 指出,隨著 AI 模型效率與效能同步提升,整體需求可能呈現「看似矛盾卻持續擴張」的趨勢,意味著技術進步未必壓抑需求,反而可能帶動更大規模應用。

此外,也有分析指出,此波記憶體類股回檔與其說是基本面轉弱,不如說是資金在高檔進行獲利了結。

記憶體產業過去一年受惠於 AI 熱潮與供給緊張,價格持續攀升,帶動相關個股大幅上漲。數據顯示,三星股價過去一年累計漲幅高達 200%,而美光與 SK 海力士漲幅更超過 300%。

TurboQuant論文將於下月舉辦的ICLR 2026上正式發表

結果非常頂:不用任何重訓,TurboQuant把快取壓縮至喪心病狂的3-bit。

這麼一來,KV快取開銷驟降6倍,關鍵是,推理表現幾乎零損耗。

在H100上,相較於32-bit基線,4-bit的計算注意力速度飆升了8倍。不僅省空間,還跑得更快了。

一時間,全網陷入瘋狂。照這樣說,16GB Mac mini又能用來跑大模型了。

 

相關新聞


29
今天




































































































































































Previous熱門時事

台股
美股
科技
🔥

【熱門時事】Google TurboQuant 橫空出世! 連日血洗記憶體族群

時事上線時間

2026-03-27 16:32:51

Google  3/24一篇論文,直接讓儲存巨頭們「集體失眠」,一夜市值蒸發幾百億!最新部落格官宣TurboQuant演算法,直接將快取壓到3-bit,記憶體佔用只有1/6。

眾所周知,大模型跑起來時,KV快取(KV cache)簡直是記憶體界的「吞金獸」。為了不重複計算之前的Token,LLM維持一份「運行記憶」,隨著對話越來越長,這份記憶會像滾雪球一樣迅速膨脹。

Google的TurboQuant,給出了一套極其「暴力」的瘦身方案:

首先,把KV快取裡的高維向量做一次「旋轉」,再換一套極坐標系來描述,記憶體開銷直接歸0。然後,用僅僅1-bit額外空間,放一個數學「校正器」進去,把壓縮帶來的系統性偏差精確抹平。

記憶體佔用暴降6倍,儲存巨頭集體重挫

對於晶片儲存巨頭來說,這無異於一場「底層邏輯大地震」。美光、西數等巨頭的估值基石,向來建立在「AI伺服器單機容量紅利」之上。一旦單次推理任務的位元(Bit)需求發生結構性驟降,高性能儲存的增長動能將直接面臨「縮水」危機。

直白講,GoogleTurboQuant出世,直接衝擊了晶片儲存巨頭們,備受追捧的AI硬體邏輯。KV快取暴降6倍,速度提升8倍,意味著每台伺服器所需的高端記憶體晶片可能變少。

美股記憶體族群週三 (25 日) 拋售潮湧現後,亞股週四 (26 日) 時段,南韓記憶體大廠三星與 SK 海力士股價分別下跌約 5% 與 6%,日本快閃記憶體廠鎧俠亦重挫近 6%。

緊接著,美股記憶體族群週四持續血染,美光 (MU-US) 週四再度跳水 6.97%,收每股 355.46 美元。威騰電子 (WDC-US) 慘跌 7.70%,收每股 273.35 美元。

SanDisk (SNDK-US) 下殺 11.02%,收每股 603.17 美元。希捷科技 (STX-US) 血崩 8.33%,收每股 378.79 美元。

市場解讀,TurboQuant 技術若成功落地商用,可能降低 AI 訓練與推論過程中對高頻寬記憶體 (HBM) 與 DRAM 的需求,進而影響整體產業成長動能。記憶體晶片一直是支撐生成式 AI 發展的關鍵硬體之一,包括 Google、OpenAI 與 Anthropic 等業者均高度依賴。

Google 版 DeepSeek 時刻

Cloudflare 執行長 Matthew Prince 將此技術形容為「Google 版 DeepSeek 時刻」,意指類似中國 AI 公司 DeepSeek 先前透過效率突破引發市場震盪。

他指出,AI 在速度、記憶體使用與能耗方面仍有大量優化空間。

不過,市場亦有不同聲音。部分分析師認為,隨著記憶體瓶頸逐步被突破,AI 模型將能處理更大規模的資料,反而可能推升整體記憶體需求,而非如市場憂慮般下降。

Kiwoom Securities 研究員 Han Ji-young 指出,隨著 AI 模型效率與效能同步提升,整體需求可能呈現「看似矛盾卻持續擴張」的趨勢,意味著技術進步未必壓抑需求,反而可能帶動更大規模應用。

此外,也有分析指出,此波記憶體類股回檔與其說是基本面轉弱,不如說是資金在高檔進行獲利了結。

記憶體產業過去一年受惠於 AI 熱潮與供給緊張,價格持續攀升,帶動相關個股大幅上漲。數據顯示,三星股價過去一年累計漲幅高達 200%,而美光與 SK 海力士漲幅更超過 300%。

TurboQuant論文將於下月舉辦的ICLR 2026上正式發表

結果非常頂:不用任何重訓,TurboQuant把快取壓縮至喪心病狂的3-bit。

這麼一來,KV快取開銷驟降6倍,關鍵是,推理表現幾乎零損耗。

在H100上,相較於32-bit基線,4-bit的計算注意力速度飆升了8倍。不僅省空間,還跑得更快了。

一時間,全網陷入瘋狂。照這樣說,16GB Mac mini又能用來跑大模型了。

 

相關新聞


29
今天