熱門時事
快速掌握近期熱門話題
Google 3/24一篇論文,直接讓儲存巨頭們「集體失眠」,一夜市值蒸發幾百億!最新部落格官宣TurboQuant演算法,直接將快取壓到3-bit,記憶體佔用只有1/6。
眾所周知,大模型跑起來時,KV快取(KV cache)簡直是記憶體界的「吞金獸」。為了不重複計算之前的Token,LLM維持一份「運行記憶」,隨著對話越來越長,這份記憶會像滾雪球一樣迅速膨脹。
Google的TurboQuant,給出了一套極其「暴力」的瘦身方案:
首先,把KV快取裡的高維向量做一次「旋轉」,再換一套極坐標系來描述,記憶體開銷直接歸0。然後,用僅僅1-bit額外空間,放一個數學「校正器」進去,把壓縮帶來的系統性偏差精確抹平。
記憶體佔用暴降6倍,儲存巨頭集體重挫
對於晶片儲存巨頭來說,這無異於一場「底層邏輯大地震」。美光、西數等巨頭的估值基石,向來建立在「AI伺服器單機容量紅利」之上。一旦單次推理任務的位元(Bit)需求發生結構性驟降,高性能儲存的增長動能將直接面臨「縮水」危機。
直白講,GoogleTurboQuant出世,直接衝擊了晶片儲存巨頭們,備受追捧的AI硬體邏輯。KV快取暴降6倍,速度提升8倍,意味著每台伺服器所需的高端記憶體晶片可能變少。
美股記憶體族群週三 (25 日) 拋售潮湧現後,亞股週四 (26 日) 時段,南韓記憶體大廠三星與 SK 海力士股價分別下跌約 5% 與 6%,日本快閃記憶體廠鎧俠亦重挫近 6%。
緊接著,美股記憶體族群週四持續血染,美光 (MU-US) 週四再度跳水 6.97%,收每股 355.46 美元。威騰電子 (WDC-US) 慘跌 7.70%,收每股 273.35 美元。
SanDisk (SNDK-US) 下殺 11.02%,收每股 603.17 美元。希捷科技 (STX-US) 血崩 8.33%,收每股 378.79 美元。
市場解讀,TurboQuant 技術若成功落地商用,可能降低 AI 訓練與推論過程中對高頻寬記憶體 (HBM) 與 DRAM 的需求,進而影響整體產業成長動能。記憶體晶片一直是支撐生成式 AI 發展的關鍵硬體之一,包括 Google、OpenAI 與 Anthropic 等業者均高度依賴。
Google 版 DeepSeek 時刻
Cloudflare 執行長 Matthew Prince 將此技術形容為「Google 版 DeepSeek 時刻」,意指類似中國 AI 公司 DeepSeek 先前透過效率突破引發市場震盪。
他指出,AI 在速度、記憶體使用與能耗方面仍有大量優化空間。
不過,市場亦有不同聲音。部分分析師認為,隨著記憶體瓶頸逐步被突破,AI 模型將能處理更大規模的資料,反而可能推升整體記憶體需求,而非如市場憂慮般下降。
Kiwoom Securities 研究員 Han Ji-young 指出,隨著 AI 模型效率與效能同步提升,整體需求可能呈現「看似矛盾卻持續擴張」的趨勢,意味著技術進步未必壓抑需求,反而可能帶動更大規模應用。
此外,也有分析指出,此波記憶體類股回檔與其說是基本面轉弱,不如說是資金在高檔進行獲利了結。
記憶體產業過去一年受惠於 AI 熱潮與供給緊張,價格持續攀升,帶動相關個股大幅上漲。數據顯示,三星股價過去一年累計漲幅高達 200%,而美光與 SK 海力士漲幅更超過 300%。
TurboQuant論文將於下月舉辦的ICLR 2026上正式發表
結果非常頂:不用任何重訓,TurboQuant把快取壓縮至喪心病狂的3-bit。
這麼一來,KV快取開銷驟降6倍,關鍵是,推理表現幾乎零損耗。
在H100上,相較於32-bit基線,4-bit的計算注意力速度飆升了8倍。不僅省空間,還跑得更快了。
一時間,全網陷入瘋狂。照這樣說,16GB Mac mini又能用來跑大模型了。
美國總統川普於週六(2/28)證實,美軍已在伊朗展開「重大作戰行動」,使中東局勢急遽升溫。川普說,伊朗正在研製威脅美國的長程飛彈。此次襲擊要摧毀伊朗的飛彈工業,消滅伊朗海軍,確保伊朗不能獲得核武。
五角大廈表示,美國將此次對伊朗的行動命名“史詩怒火”。
28日,以色列總理那坦雅胡宣布,美國和以色列發動軍事行動的目標是推翻伊朗政權。
在美國與以色列對伊朗發動聯合軍事打擊後,伊朗於週六(28 日)向以色列發射飛彈展開報復,導致以色列全境拉響防空警報、醫療體系進入最高戒備;德黑蘭多處政府與軍事設施遭襲,伊方高層強硬放話「結局不再由以色列掌控」。
川普稱,伊朗正在研發可威脅美國的遠程飛彈,此次行動旨在摧毀其飛彈工業、打擊伊朗海軍,並確保伊朗無法獲得核武。
他強調,主要目的是「消除伊朗政權對美國人民的威脅」,並警告伊朗永遠不可能擁有核武器。
美國總統川普週末在自家社群平台發文,宣稱伊朗最高領袖哈米尼已經身亡,並形容此舉是對伊朗人民以及全球受害者的「正義」。川普表示,哈米尼無法躲避美方高度先進的情報與追蹤系統,在與以色列密切合作下,美方成功鎖定並殲滅包括哈米尼在內的多名伊朗領導人。
第三次石油危機?
《路透社》3/2 援引伊朗媒體報導,一名伊朗伊斯蘭革命衛隊高階官員稱,荷姆茲海峽已關閉,伊朗將向任何企圖通過海峽的船隻開火。
荷姆茲海峽是全球最重要的石油運輸通道,連接沙烏地阿拉伯、伊朗、伊拉克、阿聯等海灣主要產油國與阿曼灣及阿拉伯海,全球約 20% 石油日消耗量都要經過該海峽。
伊朗除了使用飛彈和無人機直接攻擊船隻,還可能在海峽中布設水雷。美國情報單位估計,伊朗已儲備多達 6,000 枚水雷,包括漂流水雷、吸附式水雷、底雷和系泊水雷。
據《伊朗學生通訊社》周一報導,伊朗伊斯蘭革命衛隊指揮官賈巴里在一檔電視直播中說,任何企圖通過荷姆茲海峽的船隻都會被擊毀,「我方不會允許一滴石油從該地區流出」。
據伊朗《法爾斯通訊社》周二(3 日)報導,伊朗伊斯蘭革命衛隊海軍副司令穆罕默德 · 阿克巴爾扎德表示,荷姆茲海峽已完全處於伊朗海軍的控制之下,十多艘油輪在這片海域被炮彈擊中。
阿克巴爾扎德說,革命衛隊海軍多次警告荷姆茲海峽處於戰爭狀態,任何船隻都可能被炮彈或無人機擊中。但仍有十多艘油輪無視警告,已被炮彈擊中。
阿克巴爾扎德強調,在伊朗宣布荷姆茲海峽禁止航行後,油輪、商船和漁船已無法通過海峽。
Google 3/24一篇論文,直接讓儲存巨頭們「集體失眠」,一夜市值蒸發幾百億!最新部落格官宣TurboQuant演算法,直接將快取壓到3-bit,記憶體佔用只有1/6。
眾所周知,大模型跑起來時,KV快取(KV cache)簡直是記憶體界的「吞金獸」。為了不重複計算之前的Token,LLM維持一份「運行記憶」,隨著對話越來越長,這份記憶會像滾雪球一樣迅速膨脹。
Google的TurboQuant,給出了一套極其「暴力」的瘦身方案:
首先,把KV快取裡的高維向量做一次「旋轉」,再換一套極坐標系來描述,記憶體開銷直接歸0。然後,用僅僅1-bit額外空間,放一個數學「校正器」進去,把壓縮帶來的系統性偏差精確抹平。
記憶體佔用暴降6倍,儲存巨頭集體重挫
對於晶片儲存巨頭來說,這無異於一場「底層邏輯大地震」。美光、西數等巨頭的估值基石,向來建立在「AI伺服器單機容量紅利」之上。一旦單次推理任務的位元(Bit)需求發生結構性驟降,高性能儲存的增長動能將直接面臨「縮水」危機。
直白講,GoogleTurboQuant出世,直接衝擊了晶片儲存巨頭們,備受追捧的AI硬體邏輯。KV快取暴降6倍,速度提升8倍,意味著每台伺服器所需的高端記憶體晶片可能變少。
美股記憶體族群週三 (25 日) 拋售潮湧現後,亞股週四 (26 日) 時段,南韓記憶體大廠三星與 SK 海力士股價分別下跌約 5% 與 6%,日本快閃記憶體廠鎧俠亦重挫近 6%。
緊接著,美股記憶體族群週四持續血染,美光 (MU-US) 週四再度跳水 6.97%,收每股 355.46 美元。威騰電子 (WDC-US) 慘跌 7.70%,收每股 273.35 美元。
SanDisk (SNDK-US) 下殺 11.02%,收每股 603.17 美元。希捷科技 (STX-US) 血崩 8.33%,收每股 378.79 美元。
市場解讀,TurboQuant 技術若成功落地商用,可能降低 AI 訓練與推論過程中對高頻寬記憶體 (HBM) 與 DRAM 的需求,進而影響整體產業成長動能。記憶體晶片一直是支撐生成式 AI 發展的關鍵硬體之一,包括 Google、OpenAI 與 Anthropic 等業者均高度依賴。
Google 版 DeepSeek 時刻
Cloudflare 執行長 Matthew Prince 將此技術形容為「Google 版 DeepSeek 時刻」,意指類似中國 AI 公司 DeepSeek 先前透過效率突破引發市場震盪。
他指出,AI 在速度、記憶體使用與能耗方面仍有大量優化空間。
不過,市場亦有不同聲音。部分分析師認為,隨著記憶體瓶頸逐步被突破,AI 模型將能處理更大規模的資料,反而可能推升整體記憶體需求,而非如市場憂慮般下降。
Kiwoom Securities 研究員 Han Ji-young 指出,隨著 AI 模型效率與效能同步提升,整體需求可能呈現「看似矛盾卻持續擴張」的趨勢,意味著技術進步未必壓抑需求,反而可能帶動更大規模應用。
此外,也有分析指出,此波記憶體類股回檔與其說是基本面轉弱,不如說是資金在高檔進行獲利了結。
記憶體產業過去一年受惠於 AI 熱潮與供給緊張,價格持續攀升,帶動相關個股大幅上漲。數據顯示,三星股價過去一年累計漲幅高達 200%,而美光與 SK 海力士漲幅更超過 300%。
TurboQuant論文將於下月舉辦的ICLR 2026上正式發表
結果非常頂:不用任何重訓,TurboQuant把快取壓縮至喪心病狂的3-bit。
這麼一來,KV快取開銷驟降6倍,關鍵是,推理表現幾乎零損耗。
在H100上,相較於32-bit基線,4-bit的計算注意力速度飆升了8倍。不僅省空間,還跑得更快了。
一時間,全網陷入瘋狂。照這樣說,16GB Mac mini又能用來跑大模型了。
美國總統川普於週六(2/28)證實,美軍已在伊朗展開「重大作戰行動」,使中東局勢急遽升溫。川普說,伊朗正在研製威脅美國的長程飛彈。此次襲擊要摧毀伊朗的飛彈工業,消滅伊朗海軍,確保伊朗不能獲得核武。
五角大廈表示,美國將此次對伊朗的行動命名“史詩怒火”。
28日,以色列總理那坦雅胡宣布,美國和以色列發動軍事行動的目標是推翻伊朗政權。
在美國與以色列對伊朗發動聯合軍事打擊後,伊朗於週六(28 日)向以色列發射飛彈展開報復,導致以色列全境拉響防空警報、醫療體系進入最高戒備;德黑蘭多處政府與軍事設施遭襲,伊方高層強硬放話「結局不再由以色列掌控」。
川普稱,伊朗正在研發可威脅美國的遠程飛彈,此次行動旨在摧毀其飛彈工業、打擊伊朗海軍,並確保伊朗無法獲得核武。
他強調,主要目的是「消除伊朗政權對美國人民的威脅」,並警告伊朗永遠不可能擁有核武器。
美國總統川普週末在自家社群平台發文,宣稱伊朗最高領袖哈米尼已經身亡,並形容此舉是對伊朗人民以及全球受害者的「正義」。川普表示,哈米尼無法躲避美方高度先進的情報與追蹤系統,在與以色列密切合作下,美方成功鎖定並殲滅包括哈米尼在內的多名伊朗領導人。
第三次石油危機?
《路透社》3/2 援引伊朗媒體報導,一名伊朗伊斯蘭革命衛隊高階官員稱,荷姆茲海峽已關閉,伊朗將向任何企圖通過海峽的船隻開火。
荷姆茲海峽是全球最重要的石油運輸通道,連接沙烏地阿拉伯、伊朗、伊拉克、阿聯等海灣主要產油國與阿曼灣及阿拉伯海,全球約 20% 石油日消耗量都要經過該海峽。
伊朗除了使用飛彈和無人機直接攻擊船隻,還可能在海峽中布設水雷。美國情報單位估計,伊朗已儲備多達 6,000 枚水雷,包括漂流水雷、吸附式水雷、底雷和系泊水雷。
據《伊朗學生通訊社》周一報導,伊朗伊斯蘭革命衛隊指揮官賈巴里在一檔電視直播中說,任何企圖通過荷姆茲海峽的船隻都會被擊毀,「我方不會允許一滴石油從該地區流出」。
據伊朗《法爾斯通訊社》周二(3 日)報導,伊朗伊斯蘭革命衛隊海軍副司令穆罕默德 · 阿克巴爾扎德表示,荷姆茲海峽已完全處於伊朗海軍的控制之下,十多艘油輪在這片海域被炮彈擊中。
阿克巴爾扎德說,革命衛隊海軍多次警告荷姆茲海峽處於戰爭狀態,任何船隻都可能被炮彈或無人機擊中。但仍有十多艘油輪無視警告,已被炮彈擊中。
阿克巴爾扎德強調,在伊朗宣布荷姆茲海峽禁止航行後,油輪、商船和漁船已無法通過海峽。
Google 3/24一篇論文,直接讓儲存巨頭們「集體失眠」,一夜市值蒸發幾百億!最新部落格官宣TurboQuant演算法,直接將快取壓到3-bit,記憶體佔用只有1/6。
眾所周知,大模型跑起來時,KV快取(KV cache)簡直是記憶體界的「吞金獸」。為了不重複計算之前的Token,LLM維持一份「運行記憶」,隨著對話越來越長,這份記憶會像滾雪球一樣迅速膨脹。
Google的TurboQuant,給出了一套極其「暴力」的瘦身方案:
首先,把KV快取裡的高維向量做一次「旋轉」,再換一套極坐標系來描述,記憶體開銷直接歸0。然後,用僅僅1-bit額外空間,放一個數學「校正器」進去,把壓縮帶來的系統性偏差精確抹平。
記憶體佔用暴降6倍,儲存巨頭集體重挫
對於晶片儲存巨頭來說,這無異於一場「底層邏輯大地震」。美光、西數等巨頭的估值基石,向來建立在「AI伺服器單機容量紅利」之上。一旦單次推理任務的位元(Bit)需求發生結構性驟降,高性能儲存的增長動能將直接面臨「縮水」危機。
直白講,GoogleTurboQuant出世,直接衝擊了晶片儲存巨頭們,備受追捧的AI硬體邏輯。KV快取暴降6倍,速度提升8倍,意味著每台伺服器所需的高端記憶體晶片可能變少。
美股記憶體族群週三 (25 日) 拋售潮湧現後,亞股週四 (26 日) 時段,南韓記憶體大廠三星與 SK 海力士股價分別下跌約 5% 與 6%,日本快閃記憶體廠鎧俠亦重挫近 6%。
緊接著,美股記憶體族群週四持續血染,美光 (MU-US) 週四再度跳水 6.97%,收每股 355.46 美元。威騰電子 (WDC-US) 慘跌 7.70%,收每股 273.35 美元。
SanDisk (SNDK-US) 下殺 11.02%,收每股 603.17 美元。希捷科技 (STX-US) 血崩 8.33%,收每股 378.79 美元。
市場解讀,TurboQuant 技術若成功落地商用,可能降低 AI 訓練與推論過程中對高頻寬記憶體 (HBM) 與 DRAM 的需求,進而影響整體產業成長動能。記憶體晶片一直是支撐生成式 AI 發展的關鍵硬體之一,包括 Google、OpenAI 與 Anthropic 等業者均高度依賴。
Google 版 DeepSeek 時刻
Cloudflare 執行長 Matthew Prince 將此技術形容為「Google 版 DeepSeek 時刻」,意指類似中國 AI 公司 DeepSeek 先前透過效率突破引發市場震盪。
他指出,AI 在速度、記憶體使用與能耗方面仍有大量優化空間。
不過,市場亦有不同聲音。部分分析師認為,隨著記憶體瓶頸逐步被突破,AI 模型將能處理更大規模的資料,反而可能推升整體記憶體需求,而非如市場憂慮般下降。
Kiwoom Securities 研究員 Han Ji-young 指出,隨著 AI 模型效率與效能同步提升,整體需求可能呈現「看似矛盾卻持續擴張」的趨勢,意味著技術進步未必壓抑需求,反而可能帶動更大規模應用。
此外,也有分析指出,此波記憶體類股回檔與其說是基本面轉弱,不如說是資金在高檔進行獲利了結。
記憶體產業過去一年受惠於 AI 熱潮與供給緊張,價格持續攀升,帶動相關個股大幅上漲。數據顯示,三星股價過去一年累計漲幅高達 200%,而美光與 SK 海力士漲幅更超過 300%。
TurboQuant論文將於下月舉辦的ICLR 2026上正式發表
結果非常頂:不用任何重訓,TurboQuant把快取壓縮至喪心病狂的3-bit。
這麼一來,KV快取開銷驟降6倍,關鍵是,推理表現幾乎零損耗。
在H100上,相較於32-bit基線,4-bit的計算注意力速度飆升了8倍。不僅省空間,還跑得更快了。
一時間,全網陷入瘋狂。照這樣說,16GB Mac mini又能用來跑大模型了。