區塊鏈

HBM之父金正浩：AI的本質是內存 GPU真正工作的時間只有10%

金色財經2026-07-05 17:30

被稱為"HBM之父"的韓國科學技術院（KAIST）金正浩教授拋出一個顛覆認知的判斷：AI的本質是內存，而不是GPU。

近日，韓國科學技術院（KAIST）電氣工程系教授金正浩接受影音專訪，圍繞HBM技術演進、AI算力格局和未來半導體架構作出系統性闡述。金正浩被業界稱為"HBM之父"，早在2010年代初期便與SK海力士合作參與HBM1開發，此後主導了一系列底層架構研究。此次訪談內容在科技與投資圈廣泛流傳，核心觀點直指當前AI算力競賽的結構性矛盾。

金正浩在訪談中直接給出了一個令人震動的數字：

‌

"GPU裝100萬台，真正工作的時間只有10%。"

他解釋，每當ChatGPT輸出一個詞，系統就需要從HBM中讀取數據、完成計算、再寫回內存，"讀和寫幾乎占掉了全部時間，GPU就在旁邊乾等着。"即便通過算法優化，GPU利用率也很難突破30%。

這正是他多年堅持的核心論斷的現實依據："AI等於內存（AI = Memory）。"

一、為什麼GPU遇到了"外通死局"

金正浩對英偉達（NVIDIA）現狀的判斷措辭犀利。他說，黃仁勛近期頻繁訪問韓國、參加綜藝、吃炸雞喝啤酒、會見各路人士，"這麼多會面背後，說明他不安心"。

"GPU的技術性成長已經快停了，這是我的判斷。人工智慧計算機的進化，掌握在內存手裡。"

他的邏輯鏈條清晰：GPU想提升性能，只能擴大晶片面積、堆更多計算單元；但GPU太熱，必須在背面安裝散熱裝置，因此無法像內存一樣垂直堆疊。"GPU陷入了外通死局（外通手에 걸린 느낌）。"

相比之下，從訓練時代轉向推理時代，內存的重要性正在被重新定價。金正浩說："推理時代，更重要的是往AI里塞進多少數據，而決定這一點的半導體是內存。"

他進一步指出，AI能力的競爭最終是內存能力的競爭："谷歌Gemini、OpenAI、Anthropic Claude，誰更強，是由內存決定的——這是我的主張。"

二、HBM的兩大核心：容量與帶寬

金正浩將HBM的價值歸結為兩個維度。

第一是容量。隨著上下文工程（context engineering）、多模態輸入和Agentic AI的到來，內存需求以每年翻倍的速度增長，"10年就是1000倍"。傳統方式靠縮小晶體管來增容，但如今已逼近量子力學邊界，幾乎無法繼續縮小，因此必須"向上堆疊"。

第二是帶寬。金正浩打了個比方："傳統內存如果是8車道高速公路，HBM是1024車道，現在是2048車道，幾年後可能達到100萬車道。" 靠並行通道同時傳輸海量數據，才能匹配AI計算的速度需求。

三、HBF：NAND閃存的堆疊時代

HBM解決了速度問題，但容量依然有天花板。金正浩在訪談中詳細闡述了他認為的下一條技術路線——HBF（High Bandwidth Flash）。

簡單說，HBF就是把NAND閃存像HBM一樣垂直堆疊。DRAM速度快但容量有限，NAND閃存容量大、可長期保存數據，速度雖然慢一些，但在推理場景中足夠滿足"冷數據"的儲存需求。

金正浩認為，未來HBM和HBF將形成共存格局，類似於城市規劃："就像有百貨商場，周圍有複式公寓、普通住宅，各種形態的HBM、HBF組合在一起，形成複合體，向GPU供給數據。"

他作出了一個明確的長期預判："現在是HBM的時代，但10年後，NAND閃存和HBF的市場需求將超過HBM。三星和SK海力士必須為HBF時代做好準備。"

他指出，目前正在開發HBF的公司包括SK海力士、閃迪、三星電子，以及日本的鎧俠（Kioxia）。鎧俠市值最近超過了豐田汽車，成為日本股市第一，閃迪股價持續上漲，而三星和SK海力士則在韓國市場維持市值領先地位。

四、HBS：更超前的第三條路

金正浩還提出了一個目前仍屬於前沿概念的設想——HBS（High Bandwidth SRAM）。

SRAM（靜態隨機儲存器）比DRAM快約1000倍，但密度低、成本高，傳統上只能作為晶片內的小容量緩存。金正浩的思路是：把整張12英寸晶圓全部做成SRAM，再垂直堆疊12至16層，就能將容量從100GB擴展到1600GB。

"這樣速度快1000倍，容量又足夠，那就說得通了。"

他描述的終極AI晶片形態是一棟"100層3D大樓"："HBM、HBF、HBS各自構成多層建築，GPU放在頂層負責散熱冷卻，這就是未來AI計算機不可避免的3D半導體結構——這是我現在的判斷。"

他同時坦言，這條路最大的工程挑戰不是計算，而是供電與散熱："要給GPU和堆疊內存供幾千安培的電，電力供應網路的設計將是最難的技術，這也將成為企業間真正的核心競爭力。"

五、定製HBM：甲乙關係正在逆轉

金正浩專門談到了HBM4帶來的供需結構變化。

過去，內存是標準化產品，廠商先生產、客戶再選購，買家主導價格，庫存風險由內存廠商承擔，這就是"內存周期"的本質。

但從HBM4開始，由於需要根據英偉達、谷歌、AMD等客戶的加速器架構量身設計（即"定製HBM"），內存廠商必須在研發之初就拿到客戶的數量承諾，才會啟動開發——也就是所謂的"長期協議（Long-term Agreement）"。

"AI企業太需要高性能HBM了，所以他們排隊來。供應方開始決定價格，這是範式的轉變。"

他還預期，未來HBM晶片內將集成通信功能，實現"HBM之間相互通話"，形成類似聯盟的結構："我們自己溝通，誰對我們更好，就給誰更多內存；不聽話的GPU，就不分配。"

這進一步抬升了內存廠商的系統性地位。

六、三星、海力士是唯一能同時做兩件事的公司

金正浩在訪談中反覆強調，全球範圍內能同時量產DRAM（HBM）和NAND閃存（HBF）的公司，目前只有三星電子和SK海力士。

"閃迪和鎧俠雖然股價沖天，但只能做HBF，做不了HBM。三星和SK海力士擁有引領未來最強大的工具。"

當被問及三星與SK海力士今年合計營業利潤500兆至600兆韓元的預測是否現實，金正浩回答："現實的。" 他補充說，他經常與兩家公司的高管進行技術交流，"他們的眼神越來越亮了。"

不過他也指出競爭壓力真實存在，美光、閃迪獲得來自英偉達和谷歌的訂單分流。

七、AI PC與AI手機：內存決定設備價格

金正浩還將內存需求的敘事延伸至終端設備。

他預測，未來AI PC要真正實現個人AI計算，所需內存規模將使"一台PC的價格達到1000萬韓元，內存價格決定PC價格"。而AI智慧型手機售價300萬至500萬韓元中，200萬至300萬韓元將是內存的價格。

"AI基礎設施、AI模型的持續進化，需要越來越多的內存。AI PC和AI手機，是這個趨勢的另一條主線。"

八、Agentic AI與物理AI：內存需求還將暴增1000倍

金正浩對AI演進方向的判斷同樣值得關注。他認為，隨著Agentic AI（智能體AI）和Physical AI（具身AI/物理AI）的到來，內存使用量將比現在高出約1000倍。

"AI代理24小時工作，不像人類還要睡覺，工作量暴增，內存需求自然跟着爆炸。那時候不是HBM，而是需要"超級HBM"的時代了。"

九、研究之路：50年積累，"運氣"說

金正浩在訪談結尾追溯了自己的學術路徑。他1993年獲得博士學位，研究方向是飛秒（femtosecond）級超快電信號測量，導師數年前獲得諾貝爾物理學獎。1994年他加入三星電子內存事業部，1996年回到KAIST，此後持續深耕內存與HBM基礎研究約10年，才形成商業產品。

2015年，他在一次校內會議上第一次聽到"深度學習"這個詞，隨即意識到AI算法與HBM架構背後用的是同一套數學——線性代數和矩陣運算。"我在大學二年級特別喜歡矩陣，兩邊恰好用的是一樣的數學——這就是運氣。"

他笑言，當初做HBM時想的是用在電視機上讓畫面更生動，完全沒想到會成為AI時代的基礎設施："那時候不知道，這也可以說是運氣。"

以下為訪談文字實錄有刪減（由AI協助翻譯）

金正浩： HBM、HBF、HBS將組成一棟百層大樓，GPU則位於最頂層，進行散熱等。我認為，這種3D半導體結構是未來AI計算機不可避免的架構。而其中最困難的技術之一，就是供電。需要供應數千安培的電流，因此電力供應網路的設計將是最困難的。這將成為核心技術競爭力。

主持人：被稱為「HBM之父」的KAIST金正浩教授來到了我們的節目。您好！

金正浩：您好，很高興見到您。感謝您的邀請。

主持人：謝謝您抽出時間。

金正浩：不客氣。（笑聲）

主持人：我們得先從HBM聊起。實際上，HBM真正開始量產和應用，也不過大概兩年的時間，對吧？HBM3是這樣。HBM1的話，從2010年代開始，我就和SK海力士一起參與了，當時GPU方面有NVIDIA和AMD。所以HBM1是在2010年代初期開始的，但那時它是用於顯卡的。

主持人：教授您獲得博士學位是在1990年代，對吧？

金正浩：是的。

主持人：但您在2010年HBM最初被開發出來時，就早早地開始了相關研究。

金正浩：是的。我在1993年獲得博士學位，當時的研究更偏向物理學。我製造了當時世界上最快的、用激光來測量電信號的示波器。我的導師幾年前獲得了諾貝爾物理學獎。當時我製造的設備可以觀測到飛秒（幾乎靜止的光）級別的極端時間現象。如今隨著AI的發展，需要處理海量數據，數字電路的運行速度已經達到了皮秒甚至飛秒級別。所以30年前博士期間的研究現在都派上了用場。

不過，當時研究的領域非常狹窄和深入，而我的性格更傾向於與社會交流和溝通。所以當時我就想，未來內存會變得很重要。抱着這個想法，我在1994年加入了三星電子的內存事業部。從那時起，我就一直在學習和研究內存。1996年我來到KAIST，大約到2010年，HBM前期的基礎研究持續進行了大約10年，然後才作為產品應用到了HBM上。

HBM所需的各種技術，如量子力學、半導體物理、數學等，其實都是大學二、三年級時學過的科目。特別是需要大量的線性代數知識，那是我在1981年學習的，能一直應用到現在。HBM不斷推陳出新，我們實驗室甚至提出了到HBM8為止、為期30年的路線圖。這麼算下來，從最初研究到現在，差不多有50年了。

主持人：您在最初研究和思考HBM概念時，就預料到人工智慧時代會到來，並且HBM會成為其核心嗎？

金正浩：沒有，當時AMD和NVIDIA是打算把它用在顯卡上。顯卡所需的數學和人工智慧所需的數學是一樣的。所以HBM後來成了AI的核心部件，但最初NVIDIA方面認為它只是用在顯卡上。而我當時想，韓國電視產業很發達，所以想把這種晶片放進電視里，讓電視畫面更華麗、更生動、更逼真，因此我最初是考慮用在電視上的。

大約2015年，在大學裡和一些年輕教授開會時，他們用到了「深度學習」這個詞，那是AI的早期階段。當時我只是覺得「哦，還有這種技術啊」，半開玩笑地聊着，只有我沒聽懂。所以從那時起，大概2015年，我實際上就把專業方向轉向了AI。雖然表面上是研究HBM的實驗室，但我個人從2015年開始完全轉向了AI研究。研究幾年後發現，AI算法和HBM簡直是天作之合。我當時就覺得，這會在AI領域得到爆髮式應用。

那時候主要用在CNN（攝影機物體識別）上，稍後是強化學習（比如下圍棋），這些應用都需要大量矩陣運算，所以需要HBM。但像現在這樣徹底爆發，大概是在2020年代初ChatGPT出現的時候。未來AI將向Agentic AI發展，一部分也會走向Physical AI。從算法上看，Agentic AI或Physical AI的內存使用量可能會比現在增加1000倍。那樣的話，就需要HBM的升級版「Ultra HBM」的時代了。所以我們也有一些其他的想法。總之，一開始我並不知道會這樣，可以說是一種運氣。因為我大學二年級時就非常喜歡線性代數，而兩者用的數學是相同的。

主持人：我理解HBM就是將多個DRAM堆疊起來，我的理解正確嗎？

金正浩：是的，正確。無論是顯卡還是AI，在進行計算時，都需要快速從內存中讀取數據。HBM之所以必要，有兩個原因。第一是容量要大。特別是AI正在向上下文工程、多模態、Physical AI發展，需要在內存中累積的數據量越來越大。可能每年翻一倍，十年就是1000倍。要增加內存容量，就需要不斷縮小晶體管或儲存單元，但由於單元間的干擾和漏電現象，我們已經接近了量子力學的極限，難以再縮小。所以容量很難增加。

因此我在2000年代初就認為，未來的內存必須堆疊起來。從那時起，我們就主張「堆疊」而非「平面」。當時大多數人都設計單層半導體，而我們的設計方向是堆疊。當然我們側重設計，三星和SK海力士負責具體實現，但最終產品化的結果就是HBM。第二個原因是，即使容量大，也必須能快速將數據傳輸給GPU。這樣才能快速響應我們，處理文檔、文字，甚至最近需要製作電影。要提高速度，需要並行傳輸數據的技術。就像高速公路從8車道變成了1024車道，最近是2048車道，幾年後可能變成百萬車道。

所以HBM的核心是：通過堆疊增加容量，同時通過安裝「電梯」和「高速公路」結構，以光速（比傳統內存快千倍、百萬倍）傳輸數據，這就是所謂的並行結構。

主持人：提到HBM，也常聽到HBF。HBF是什麼，和HBM有何不同？

金正浩：通用內存主要有兩種：DRAM和NAND Flash。DRAM速度快但無法長期儲存；而NAND Flash容量大（大約是DRAM的10倍），速度慢一些，但能長期保存，主要用於相機等設備。但剛才提到的HBM雖然堆疊了，容量仍然不足。最近因為上下文工程，向AI輸入時不僅用文本，還附帶參考文件、YouTube影音等，影音圖像文件暴增，內存容量需求比現在更大。計算過程中的中間結果（KV Cache）也需要全部儲存。

進入Agentic AI時代，我可能會僱傭10個或100個AI替我工作，AI的工作量是我的100倍，而且它們24小時工作，不像我們會睡覺休息，所以工作量劇增，內存需求也隨之增加。即便堆疊了DRAM，容量還是不夠，所以想到了堆疊NAND Flash，這就是HBF。目前開發HBF的公司有SK海力士、Sandisk、三星電子，日本的Kioxia可能也在開發。最近Kioxia的市值甚至超過了豐田，成為日本股市第一。美國製造NAND Flash或HBF的Micron和Sandisk股價也持續上漲，韓國製造這些的三星和SK海力士市值排名前列。

緊挨着GPU的內存有兩種：HBM和HBF，也叫「熱內存」；而用於長期記錄AI關於用戶資訊的設備叫「冷內存」，兩者需求都在增長。長遠來看，大約10年後，NAND Flash和HBF的市場需求增長可能會超過HBM。所以現在雖然是HBM時代，但三星、SK海力士也要為HBF時代做好準備，這是我的主張。

主持人：您曾提到2038年左右HBM可能會發展到第八代。

金正浩：是的。

主持人：那時HBM和HBF都將進入商業化階段，兩者是互補關係，還是競爭關係？

金正浩：兩者是互補的。HBM4今年推出，幾年後HBM5會出來，大約每三年換一代，10年後會到HBM8。那時HBM和HBF將一起使用。HBM容量雖小但速度快，HBF速度稍慢，也有一些物理侷限性，但容量巨大。如果HBM容量不夠，旁邊會配上HBF，兩者並非單一存在，而是類似公寓樓群：中心有百貨商店（HBM），周圍有公寓樓群（HBF）。各種形態的HBM和HBF會組成一個綜合體，相互連接，為用戶提供數據。總容量方面，HBF可能比HBM更大。

主持人：歸根結底，就是堆疊DRAM還是NAND Flash的區別，兩者缺一不可。

金正浩：是的，全球能同時做這兩種的公司只有三星電子和SK海力士。Sandisk和Kioxia雖然股價飆升，但它們只能做HBF（或堆疊NAND的ESSD技術），無法做HBM。所以我認為三星電子和SK海力士擁有引領未來的最強大工具。

主持人：那麼可以說三星電子和SK海力士擁有絕對的領先優勢嗎？

金正浩：可以這麼說。今天早上的股價不就突破9000了嗎？雖然預測股價不是我的領域，但從根本趨勢看，世界正走向AI霸權時代，而AI的能力，我認為是由內存能力決定的。直到去年，我還以為AI能力源自數學（比如注意力機制），但要實現它離不開內存。最終，內存的性能就是AI的性能。所以我定義「AI = 內存」。AI企業、AI國家，或者用半導體建設數據中心，都必須依靠內存公司。這是格局轉變的時代。

更驚人的是，HBM和HBF用於建設AI數據中心，現在也叫「AI工廠」——製造AI的工廠。我稱之為「內存工廠」，AI工廠的核心是內存，擁有多少內存決定了AI國家霸權和AI企業的競爭力。谷歌、Gemini、OpenAI、Anthropic Claude誰更好？我的主張是，這由內存決定。

最近為了保護個人資訊，出現了在自己的電腦上直接計算AI的動向，這叫AIPC。NVIDIA也想做這個，和台積電合作製造PC，裡面裝有128GB的LPDDR之類，內存非常大。要真正做好可能需要TB級內存，那PC價格就得1000萬韓元，內存價格決定了PC價格。未來智慧型手機也會變成AI智慧型手機，屏幕上可能只留一個窗口，其他都由AI代勞，甚至會出現AI眼鏡。我主張一台AI手機價格的一半以上會是內存價格，比如300萬、500萬韓元的手機，其中200萬、300萬是內存成本。AI基礎設施和AI模型越發展，內存需求越大，而AI PC和AI手機是另一大增長軸。

主持人：當前全球科技巨頭中，NVIDIA展現壓倒性性能，它保持最強地位的最大秘訣是什麼？

金正浩：直到去年，AI的「學習」（訓練）更為重要，學習能力就是AI能力。在學習中，Transformer模型的編碼器部分主要進行反向傳播計算，涉及微分，能做好這個的是GPU。所以訓練時代是GPU的時代，因為做AI必須有GPU，所以大家搶着高價購買。但從去年夏天開始，「推理」變得更重要。僅靠訓練無法克服「幻覺」問題，給出荒謬錯誤答案就無法使用。要實現個人化AI，推理變得重要，而對推理更重要的半導體是內存。所以進入推理時代，內存會比GPU更貴、需求量更大。

另一個原因是，要提高GPU性能，必須增大GPU面積（放入更多計算器）。一種方法是像Cerebras公司那樣，讓整個12英寸晶圓成為一個GPU。但這樣製造難度大，一個缺陷就要扔掉整個晶圓，不經濟，用途受限。但即便如此，Cerebras也離不開HBM和HBF，沒有內存，在推理時代就會很弱。那麼NVIDIA能否堆疊GPU呢？不能，因為太熱了，後面得裝冷卻器，無法堆疊。所以GPU有些被困住了的感覺。最近黃仁勛坐立不安，來韓國上電視、扔棒球、吃炸雞喝啤酒、見很多人，說明他並不安逸。其中一個原因就是，我認為GPU的技術成長幾乎停滯了。相反，AI計算機的成長和進化取決於內存。

主持人：有說法是，實際運行的GPU只有10%？

金正浩：是的。即使安裝了100萬個GPU，實際工作時間可能只有20%，甚至10%。為什麼？因為GPU需要從內存獲取數據才能計算並返回結果，但數據從內存（HBM/HBF）傳輸不過來。當ChatGPT快速吐出單詞時，每個瞬間都需要從HBM/HBF讀取數據、計算、再寫入，幾乎全部時間都花在讀寫上，GPU在等待。所以關鍵在於能否快速讀取、讀取多少，這就是需要HBM和HBF的原因。無論如何改進算法，GPU實際工作可能最多隻有30%，其餘時間在空轉。

主持人：所以教授您主張，未來HBM或HBF內部會集成GPU功能，開啟新時代？

金正浩：是的。既然HBM/HBF的數據讓GPU在等待，那不如我們自己計算。就好比在公寓一樓安裝GPU，數據坐電梯下來計算，整棟樓里解決所有事，不用去別的地方，省去了奔波時間。所以主張在HBM里放入CPU/GPU功能，甚至讓GPU「靠邊站」。當然不能讓GPU完全沒事做，要適當分工，讓它「一直保持渴求狀態」。這就是我所說的「Memory-Centric Computing」（以內存為中心的計算）。從HBM4開始，已經在朝這個方向做了。

主持人：即使HBM/HBF里集成了GPU功能，因為沒有堆疊多個GPU，散熱問題應該不存在吧？

金正浩：還是會有一點散熱問題。所以從HBM4開始，SK海力士和三星製造的產品性能可能會有差異，這和散熱有關——能否有效排出熱量。因為在一樓（內存層）集成了部分GPU功能，那裡太熱，內存就像坐在「暖炕」上，性能會下降，必須給暖炕降溫。誰能更好地冷卻，將決定HBM4及以後產品的性能差異，GPU也是如此。所以我們實驗室的想法是，既然一層太熱，不如把部分功能移到「屋頂」（頂層），在上面加裝冷卻塔，從頂部直接冷卻。這是我們的核心架構之一，目前在HBM5相關研究中，碩博士們正在進行這項研究，希望能大獲成功。

我們發表這些論文後，NVIDIA、AMD、三星、海力士都會看到，起初可能排斥，但發現沒有別的辦法，最終會採納。

主持人：如果教授所說的HBM/HBF內部集成GPU的未來到來，甚至以後集成CPU，那三星電子和SK海力士應該會發展得更好吧？

金正浩：是的，機會正在到來。「發展得更好」意味著掌握更多主導權，甚至可能超越NVIDIA。但要實現這一點，需要技術開發、投資、人才培養，以及良好的政策判斷和經營管理層的開放思維和正確判斷。管理層的判斷最重要。

主持人：教授主張「即將進入內存時代而非GPU時代」，這似乎已經開始了。另外，最近GPU勢頭很猛，但也出現了NPU，NPU是什麼？

金正浩：都是處理器，用於矩陣計算，都用於AI。GPU原本是GPGPU，TPU里也包含HBM，所以都離不開HBM、離不開內存。Gemini能寫文章、處理語言模型、畫畫，功能多樣；而有些晶片只擅長寫文章，為特定目的簡化，就是NPU。也有人叫LPU。它們都是AI所需的計算器，根據特殊用途做得更小、功耗更低、成本更低。國內有Rebellions、FuriosaAI、HyperExcel等公司，全球大約有十幾家做NPU的，但無論Rebellions還是FuriosaAI，為了高性能都必須使用HBM。

主持人：最近FuriosaAI和Rebellions獲得了國民成長基金的大規模投資，這是要讓它們真正和NVIDIA一較高下。這兩家公司真有全球競爭力嗎？

金正浩：我當時是評審委員之一。這個決策有這樣的考量：NVIDIA無法掌控全世界所有領域，NPU、TPU等肯定存在利基市場。比如沙烏地阿拉伯阿拉伯建數據中心，如果全部用美國產品，依賴度太高，所以可能將其中10%採用其他解決方案，韓國NPU企業可以成為候選。另外，韓國國內建設AI數據中心（可能需要百萬台設備），如果100%都用NVIDIA晶片，我們對海外的依賴度太高，需要培育本土企業。所以決定投資以培育國內企業。總體概括就是這樣。技術上也有其優點。

主持人：教授您最近的研究中提出了「高帶寬SRAM（HBS）」的概念？

金正浩：是的，這是我最近提出的新概念。像之前提到的，我提出概念，但要實現需要三星、SK海力士等公司的大量努力。這些概念往往在10年、20年後會產生重大影響。我提到過Cerebras，有巨大的GPU，美國也有叫LPU的晶片。它們為了自尊心或減少對HBM的依賴，在GPU內部集成了SRAM作為內存。SRAM比DRAM快約1000倍，但容量小。我研究了一下，無論是Cerebras還是LPU，都面臨SRAM容量不足的問題。據我了解，整個12英寸晶圓做成的Cerebras晶片，SRAM也只有44GB，而我認為至少需要400到440GB才有意義。

所以我的想法是：製造一個將整個12英寸晶圓鋪滿SRAM的晶片，然後再把它堆疊10層、12層或16層。這樣100GB就能變成1600GB，容量驚人。然後在這個晶圓級SRAM堆疊體上再放置GPU。速度是千倍之快，容量又足夠，這主意聽起來可行。所以我把這個晶圓級SRAM稱為HBS。我未來的夢想是：HBM、HBF、HBS都變成100層高的大樓，GPU放在最頂層，冷卻系統等也集成在一起，這種3D半導體結構將不可避免地成為未來AI計算機的架構。

這可能需要10年、20年甚至30年。其中最困難的技術之一就是供電。在HBS、HBM上面堆疊GPU，需要供應數千安培電流，電力供應網路設計將是最困難的，這將成為技術核心競爭力。SK海力士、三星、Micron、TSMC都一樣，其次是如何散熱，這是實現過程中的障礙。目前人們關注TSMC和三星誰在幾納米工藝上做得好、良率如何，但未來，對於包含HBS在內的3D AI計算機，如何供電、如何冷卻，將決定企業的生存。

主持人： HBS簡直是內存半導體領域的「黃政民」（比喻大腕）。

金正浩：是「黃政民」沒錯。我10年前就聽說Cerebras用12英寸晶圓做GPU，當時心想「什麼？這能用在哪兒？」大概是國防AI吧。當時我還挺自大。但兩周前，這家公司在那斯達克IPO了，讓我改變了想法。還是有用途的。既然Cerebras晶片最大的弱點是內存不足，那就把它也堆疊起來。有一天早上我有了這個想法，讓學生畫了圖。最近開始談論HBF，等今年碩士新生入學，我打算讓他們開始以HBS作為碩博士論文研究方向。

主持人：那SRAM由誰製造？

金正浩：由代工廠製造，TSMC和三星電子都會做。

主持人：今年三星和SK海力士的合計營業利潤據說在500到600兆韓元之間，這是現實的目標還是過於樂觀的展望？

金正浩：我認為是現實的。我經常與三星和海力士的高管進行技術會議，感覺他們的眼神越來越亮。雖然他們不和我談具體的銷售額。現在HBM、HBF的一個重要特點是「定製化HBM」。以前是製造標準化產品，大量生產，客戶買多買少，價格波動，這叫「周期」。內存廠商不主導，而是由CPU廠商、微軟或電腦廠商決定購買數量，我們只能多生產一些觀望，如果客戶不買，庫存壓力就在我們身上，這就是「內存周期」。

但從HBM4開始，不僅集成GPU功能，另一個重要功能是HBM之間可以相互通信。以前只做GPU指令的事，現在主張它們之間也要溝通。未來，HBM之間可以競爭，把更多內存分配給表現更好的HBM。也就是說，它們內部形成組合，不給表現差的HBM向GPU傳遞數據的機會。總之，隨著這些算法、通信功能、GPU功能的加入，每個公司（谷歌、AMD、NVIDIA）對HBM的設計要求都不同，這就是定製化HBM。這樣在開發初期就簽訂了長期供貨協議（LTA），沒有訂單就不開始開發。

現在AI企業極度需要高性能HBM，所以排隊求購，市場變成了賣方市場，供方定價。這是一種範式轉變。

主持人：到現在為止，我們與KAIST金正浩教授就半導體生態進行了對話。感謝您今天的分享。

金正浩：謝謝。

來源：金色財經

發佈者對本文章的內容承擔全部責任
在投資加密貨幣前，請務必深入研究，理解相關風險，並謹慎評估自己的風險承受能力。不要因為短期高回報的誘惑而忽視潛在的重大損失。

暢行幣圈交易全攻略，專家駐群實戰交流

▌立即加入鉅亨買幣實戰交流 LINE 社群（點此入群）
不管是新手發問，還是老手交流，只要你想參與加密貨幣現貨交易、合約跟單、合約網格、量化交易、理財產品的投資，都歡迎入群討論學習！

▶ 前往鉅亨買幣找交易所優惠

‌

文章標籤

金色財經加密貨幣虛擬貨幣 BTC

延伸閱讀

鉅亨講座

看更多

講座
公告

‌

‌

‌

‌