HBM之父金正浩:AI的本質是內存 GPU真正工作的時間只有10%
金色財經
被稱為"HBM之父"的韓國科學技術院(KAIST)金正浩教授拋出一個顛覆認知的判斷:AI的本質是內存,而不是GPU。
近日,韓國科學技術院(KAIST)電氣工程系教授金正浩接受影音專訪,圍繞HBM技術演進、AI算力格局和未來半導體架構作出系統性闡述。金正浩被業界稱為"HBM之父",早在2010年代初期便與SK海力士合作參與HBM1開發,此後主導了一系列底層架構研究。此次訪談內容在科技與投資圈廣泛流傳,核心觀點直指當前AI算力競賽的結構性矛盾。
金正浩在訪談中直接給出了一個令人震動的數字:
"GPU裝100萬台,真正工作的時間只有10%。"
他解釋,每當ChatGPT輸出一個詞,系統就需要從HBM中讀取數據、完成計算、再寫回內存,"讀和寫幾乎占掉了全部時間,GPU就在旁邊乾等着。"即便通過算法優化,GPU利用率也很難突破30%。
這正是他多年堅持的核心論斷的現實依據:"AI等於內存(AI = Memory)。"
一、為什麼GPU遇到了"外通死局"
金正浩對英偉達(NVIDIA)現狀的判斷措辭犀利。他說,黃仁勛近期頻繁訪問韓國、參加綜藝、吃炸雞喝啤酒、會見各路人士,"這麼多會面背後,說明他不安心"。
"GPU的技術性成長已經快停了,這是我的判斷。人工智慧計算機的進化,掌握在內存手裡。"
他的邏輯鏈條清晰:GPU想提升性能,只能擴大晶片面積、堆更多計算單元;但GPU太熱,必須在背面安裝散熱裝置,因此無法像內存一樣垂直堆疊。"GPU陷入了外通死局(外通手에 걸린 느낌)。"
相比之下,從訓練時代轉向推理時代,內存的重要性正在被重新定價。金正浩說:"推理時代,更重要的是往AI里塞進多少數據,而決定這一點的半導體是內存。"
他進一步指出,AI能力的競爭最終是內存能力的競爭:"谷歌Gemini、OpenAI、Anthropic Claude,誰更強,是由內存決定的——這是我的主張。"
二、HBM的兩大核心:容量與帶寬
金正浩將HBM的價值歸結為兩個維度。
第一是容量。隨著上下文工程(context engineering)、多模態輸入和Agentic AI的到來,內存需求以每年翻倍的速度增長,"10年就是1000倍"。傳統方式靠縮小晶體管來增容,但如今已逼近量子力學邊界,幾乎無法繼續縮小,因此必須"向上堆疊"。
第二是帶寬。金正浩打了個比方:"傳統內存如果是8車道高速公路,HBM是1024車道,現在是2048車道,幾年後可能達到100萬車道。" 靠並行通道同時傳輸海量數據,才能匹配AI計算的速度需求。
三、HBF:NAND閃存的堆疊時代
HBM解決了速度問題,但容量依然有天花板。金正浩在訪談中詳細闡述了他認為的下一條技術路線——HBF(High Bandwidth Flash)。
簡單說,HBF就是把NAND閃存像HBM一樣垂直堆疊。DRAM速度快但容量有限,NAND閃存容量大、可長期保存數據,速度雖然慢一些,但在推理場景中足夠滿足"冷數據"的儲存需求。
金正浩認為,未來HBM和HBF將形成共存格局,類似於城市規劃:"就像有百貨商場,周圍有複式公寓、普通住宅,各種形態的HBM、HBF組合在一起,形成複合體,向GPU供給數據。"
他作出了一個明確的長期預判:"現在是HBM的時代,但10年後,NAND閃存和HBF的市場需求將超過HBM。三星和SK海力士必須為HBF時代做好準備。"
他指出,目前正在開發HBF的公司包括SK海力士、閃迪、三星電子,以及日本的鎧俠(Kioxia)。鎧俠市值最近超過了豐田汽車,成為日本股市第一,閃迪股價持續上漲,而三星和SK海力士則在韓國市場維持市值領先地位。
四、HBS:更超前的第三條路
金正浩還提出了一個目前仍屬於前沿概念的設想——HBS(High Bandwidth SRAM)。
SRAM(靜態隨機儲存器)比DRAM快約1000倍,但密度低、成本高,傳統上只能作為晶片內的小容量緩存。金正浩的思路是:把整張12英寸晶圓全部做成SRAM,再垂直堆疊12至16層,就能將容量從100GB擴展到1600GB。
"這樣速度快1000倍,容量又足夠,那就說得通了。"
他描述的終極AI晶片形態是一棟"100層3D大樓":"HBM、HBF、HBS各自構成多層建築,GPU放在頂層負責散熱冷卻,這就是未來AI計算機不可避免的3D半導體結構——這是我現在的判斷。"
他同時坦言,這條路最大的工程挑戰不是計算,而是供電與散熱:"要給GPU和堆疊內存供幾千安培的電,電力供應網路的設計將是最難的技術,這也將成為企業間真正的核心競爭力。"
五、定製HBM:甲乙關係正在逆轉
金正浩專門談到了HBM4帶來的供需結構變化。
過去,內存是標準化產品,廠商先生產、客戶再選購,買家主導價格,庫存風險由內存廠商承擔,這就是"內存周期"的本質。
但從HBM4開始,由於需要根據英偉達、谷歌、AMD等客戶的加速器架構量身設計(即"定製HBM"),內存廠商必須在研發之初就拿到客戶的數量承諾,才會啟動開發——也就是所謂的"長期協議(Long-term Agreement)"。
"AI企業太需要高性能HBM了,所以他們排隊來。供應方開始決定價格,這是範式的轉變。"
他還預期,未來HBM晶片內將集成通信功能,實現"HBM之間相互通話",形成類似聯盟的結構:"我們自己溝通,誰對我們更好,就給誰更多內存;不聽話的GPU,就不分配。"
這進一步抬升了內存廠商的系統性地位。
六、三星、海力士是唯一能同時做兩件事的公司
金正浩在訪談中反覆強調,全球範圍內能同時量產DRAM(HBM)和NAND閃存(HBF)的公司,目前只有三星電子和SK海力士。
"閃迪和鎧俠雖然股價沖天,但只能做HBF,做不了HBM。三星和SK海力士擁有引領未來最強大的工具。"
當被問及三星與SK海力士今年合計營業利潤500兆至600兆韓元的預測是否現實,金正浩回答:"現實的。" 他補充說,他經常與兩家公司的高管進行技術交流,"他們的眼神越來越亮了。"
不過他也指出競爭壓力真實存在,美光、閃迪獲得來自英偉達和谷歌的訂單分流。
七、AI PC與AI手機:內存決定設備價格
金正浩還將內存需求的敘事延伸至終端設備。
他預測,未來AI PC要真正實現個人AI計算,所需內存規模將使"一台PC的價格達到1000萬韓元,內存價格決定PC價格"。而AI智慧型手機售價300萬至500萬韓元中,200萬至300萬韓元將是內存的價格。
"AI基礎設施、AI模型的持續進化,需要越來越多的內存。AI PC和AI手機,是這個趨勢的另一條主線。"
八、Agentic AI與物理AI:內存需求還將暴增1000倍
金正浩對AI演進方向的判斷同樣值得關注。他認為,隨著Agentic AI(智能體AI)和Physical AI(具身AI/物理AI)的到來,內存使用量將比現在高出約1000倍。
"AI代理24小時工作,不像人類還要睡覺,工作量暴增,內存需求自然跟着爆炸。那時候不是HBM,而是需要"超級HBM"的時代了。"
九、研究之路:50年積累,"運氣"說
金正浩在訪談結尾追溯了自己的學術路徑。他1993年獲得博士學位,研究方向是飛秒(femtosecond)級超快電信號測量,導師數年前獲得諾貝爾物理學獎。1994年他加入三星電子內存事業部,1996年回到KAIST,此後持續深耕內存與HBM基礎研究約10年,才形成商業產品。
2015年,他在一次校內會議上第一次聽到"深度學習"這個詞,隨即意識到AI算法與HBM架構背後用的是同一套數學——線性代數和矩陣運算。"我在大學二年級特別喜歡矩陣,兩邊恰好用的是一樣的數學——這就是運氣。"
他笑言,當初做HBM時想的是用在電視機上讓畫面更生動,完全沒想到會成為AI時代的基礎設施:"那時候不知道,這也可以說是運氣。"
以下為訪談文字實錄有刪減(由AI協助翻譯)
金正浩: HBM、HBF、HBS將組成一棟百層大樓,GPU則位於最頂層,進行散熱等。我認為,這種3D半導體結構是未來AI計算機不可避免的架構。而其中最困難的技術之一,就是供電。需要供應數千安培的電流,因此電力供應網路的設計將是最困難的。這將成為核心技術競爭力。
主持人: 被稱為「HBM之父」的KAIST金正浩教授來到了我們的節目。您好!
金正浩: 您好,很高興見到您。感謝您的邀請。
主持人: 謝謝您抽出時間。
金正浩: 不客氣。(笑聲)
主持人: 我們得先從HBM聊起。實際上,HBM真正開始量產和應用,也不過大概兩年的時間,對吧?HBM3是這樣。HBM1的話,從2010年代開始,我就和SK海力士一起參與了,當時GPU方面有NVIDIA和AMD。所以HBM1是在2010年代初期開始的,但那時它是用於顯卡的。
主持人: 教授您獲得博士學位是在1990年代,對吧?
金正浩: 是的。
主持人: 但您在2010年HBM最初被開發出來時,就早早地開始了相關研究。
金正浩: 是的。我在1993年獲得博士學位,當時的研究更偏向物理學。我製造了當時世界上最快的、用激光來測量電信號的示波器。我的導師幾年前獲得了諾貝爾物理學獎。當時我製造的設備可以觀測到飛秒(幾乎靜止的光)級別的極端時間現象。如今隨著AI的發展,需要處理海量數據,數字電路的運行速度已經達到了皮秒甚至飛秒級別。所以30年前博士期間的研究現在都派上了用場。
不過,當時研究的領域非常狹窄和深入,而我的性格更傾向於與社會交流和溝通。所以當時我就想,未來內存會變得很重要。抱着這個想法,我在1994年加入了三星電子的內存事業部。從那時起,我就一直在學習和研究內存。1996年我來到KAIST,大約到2010年,HBM前期的基礎研究持續進行了大約10年,然後才作為產品應用到了HBM上。
HBM所需的各種技術,如量子力學、半導體物理、數學等,其實都是大學二、三年級時學過的科目。特別是需要大量的線性代數知識,那是我在1981年學習的,能一直應用到現在。HBM不斷推陳出新,我們實驗室甚至提出了到HBM8為止、為期30年的路線圖。這麼算下來,從最初研究到現在,差不多有50年了。
主持人: 您在最初研究和思考HBM概念時,就預料到人工智慧時代會到來,並且HBM會成為其核心嗎?
金正浩: 沒有,當時AMD和NVIDIA是打算把它用在顯卡上。顯卡所需的數學和人工智慧所需的數學是一樣的。所以HBM後來成了AI的核心部件,但最初NVIDIA方面認為它只是用在顯卡上。而我當時想,韓國電視產業很發達,所以想把這種晶片放進電視里,讓電視畫面更華麗、更生動、更逼真,因此我最初是考慮用在電視上的。
大約2015年,在大學裡和一些年輕教授開會時,他們用到了「深度學習」這個詞,那是AI的早期階段。當時我只是覺得「哦,還有這種技術啊」,半開玩笑地聊着,只有我沒聽懂。所以從那時起,大概2015年,我實際上就把專業方向轉向了AI。雖然表面上是研究HBM的實驗室,但我個人從2015年開始完全轉向了AI研究。研究幾年後發現,AI算法和HBM簡直是天作之合。我當時就覺得,這會在AI領域得到爆髮式應用。
那時候主要用在CNN(攝影機物體識別)上,稍後是強化學習(比如下圍棋),這些應用都需要大量矩陣運算,所以需要HBM。但像現在這樣徹底爆發,大概是在2020年代初ChatGPT出現的時候。未來AI將向Agentic AI發展,一部分也會走向Physical AI。從算法上看,Agentic AI或Physical AI的內存使用量可能會比現在增加1000倍。那樣的話,就需要HBM的升級版「Ultra HBM」的時代了。所以我們也有一些其他的想法。總之,一開始我並不知道會這樣,可以說是一種運氣。因為我大學二年級時就非常喜歡線性代數,而兩者用的數學是相同的。
主持人: 我理解HBM就是將多個DRAM堆疊起來,我的理解正確嗎?
金正浩: 是的,正確。無論是顯卡還是AI,在進行計算時,都需要快速從內存中讀取數據。HBM之所以必要,有兩個原因。第一是容量要大。特別是AI正在向上下文工程、多模態、Physical AI發展,需要在內存中累積的數據量越來越大。可能每年翻一倍,十年就是1000倍。要增加內存容量,就需要不斷縮小晶體管或儲存單元,但由於單元間的干擾和漏電現象,我們已經接近了量子力學的極限,難以再縮小。所以容量很難增加。
因此我在2000年代初就認為,未來的內存必須堆疊起來。從那時起,我們就主張「堆疊」而非「平面」。當時大多數人都設計單層半導體,而我們的設計方向是堆疊。當然我們側重設計,三星和SK海力士負責具體實現,但最終產品化的結果就是HBM。第二個原因是,即使容量大,也必須能快速將數據傳輸給GPU。這樣才能快速響應我們,處理文檔、文字,甚至最近需要製作電影。要提高速度,需要並行傳輸數據的技術。就像高速公路從8車道變成了1024車道,最近是2048車道,幾年後可能變成百萬車道。
所以HBM的核心是:通過堆疊增加容量,同時通過安裝「電梯」和「高速公路」結構,以光速(比傳統內存快千倍、百萬倍)傳輸數據,這就是所謂的並行結構。
主持人: 提到HBM,也常聽到HBF。HBF是什麼,和HBM有何不同?
金正浩: 通用內存主要有兩種:DRAM和NAND Flash。DRAM速度快但無法長期儲存;而NAND Flash容量大(大約是DRAM的10倍),速度慢一些,但能長期保存,主要用於相機等設備。但剛才提到的HBM雖然堆疊了,容量仍然不足。最近因為上下文工程,向AI輸入時不僅用文本,還附帶參考文件、YouTube影音等,影音圖像文件暴增,內存容量需求比現在更大。計算過程中的中間結果(KV Cache)也需要全部儲存。
進入Agentic AI時代,我可能會僱傭10個或100個AI替我工作,AI的工作量是我的100倍,而且它們24小時工作,不像我們會睡覺休息,所以工作量劇增,內存需求也隨之增加。即便堆疊了DRAM,容量還是不夠,所以想到了堆疊NAND Flash,這就是HBF。目前開發HBF的公司有SK海力士、Sandisk、三星電子,日本的Kioxia可能也在開發。最近Kioxia的市值甚至超過了豐田,成為日本股市第一。美國製造NAND Flash或HBF的Micron和Sandisk股價也持續上漲,韓國製造這些的三星和SK海力士市值排名前列。
緊挨着GPU的內存有兩種:HBM和HBF,也叫「熱內存」;而用於長期記錄AI關於用戶資訊的設備叫「冷內存」,兩者需求都在增長。長遠來看,大約10年後,NAND Flash和HBF的市場需求增長可能會超過HBM。所以現在雖然是HBM時代,但三星、SK海力士也要為HBF時代做好準備,這是我的主張。
主持人: 您曾提到2038年左右HBM可能會發展到第八代。
金正浩: 是的。
主持人: 那時HBM和HBF都將進入商業化階段,兩者是互補關係,還是競爭關係?
金正浩: 兩者是互補的。HBM4今年推出,幾年後HBM5會出來,大約每三年換一代,10年後會到HBM8。那時HBM和HBF將一起使用。HBM容量雖小但速度快,HBF速度稍慢,也有一些物理侷限性,但容量巨大。如果HBM容量不夠,旁邊會配上HBF,兩者並非單一存在,而是類似公寓樓群:中心有百貨商店(HBM),周圍有公寓樓群(HBF)。各種形態的HBM和HBF會組成一個綜合體,相互連接,為用戶提供數據。總容量方面,HBF可能比HBM更大。
主持人: 歸根結底,就是堆疊DRAM還是NAND Flash的區別,兩者缺一不可。
金正浩: 是的,全球能同時做這兩種的公司只有三星電子和SK海力士。Sandisk和Kioxia雖然股價飆升,但它們只能做HBF(或堆疊NAND的ESSD技術),無法做HBM。所以我認為三星電子和SK海力士擁有引領未來的最強大工具。
主持人: 那麼可以說三星電子和SK海力士擁有絕對的領先優勢嗎?
金正浩: 可以這麼說。今天早上的股價不就突破9000了嗎?雖然預測股價不是我的領域,但從根本趨勢看,世界正走向AI霸權時代,而AI的能力,我認為是由內存能力決定的。直到去年,我還以為AI能力源自數學(比如注意力機制),但要實現它離不開內存。最終,內存的性能就是AI的性能。所以我定義「AI = 內存」。AI企業、AI國家,或者用半導體建設數據中心,都必須依靠內存公司。這是格局轉變的時代。
更驚人的是,HBM和HBF用於建設AI數據中心,現在也叫「AI工廠」——製造AI的工廠。我稱之為「內存工廠」,AI工廠的核心是內存,擁有多少內存決定了AI國家霸權和AI企業的競爭力。谷歌、Gemini、OpenAI、Anthropic Claude誰更好?我的主張是,這由內存決定。
最近為了保護個人資訊,出現了在自己的電腦上直接計算AI的動向,這叫AIPC。NVIDIA也想做這個,和台積電合作製造PC,裡面裝有128GB的LPDDR之類,內存非常大。要真正做好可能需要TB級內存,那PC價格就得1000萬韓元,內存價格決定了PC價格。未來智慧型手機也會變成AI智慧型手機,屏幕上可能只留一個窗口,其他都由AI代勞,甚至會出現AI眼鏡。我主張一台AI手機價格的一半以上會是內存價格,比如300萬、500萬韓元的手機,其中200萬、300萬是內存成本。AI基礎設施和AI模型越發展,內存需求越大,而AI PC和AI手機是另一大增長軸。
主持人: 當前全球科技巨頭中,NVIDIA展現壓倒性性能,它保持最強地位的最大秘訣是什麼?
金正浩: 直到去年,AI的「學習」(訓練)更為重要,學習能力就是AI能力。在學習中,Transformer模型的編碼器部分主要進行反向傳播計算,涉及微分,能做好這個的是GPU。所以訓練時代是GPU的時代,因為做AI必須有GPU,所以大家搶着高價購買。但從去年夏天開始,「推理」變得更重要。僅靠訓練無法克服「幻覺」問題,給出荒謬錯誤答案就無法使用。要實現個人化AI,推理變得重要,而對推理更重要的半導體是內存。所以進入推理時代,內存會比GPU更貴、需求量更大。
另一個原因是,要提高GPU性能,必須增大GPU面積(放入更多計算器)。一種方法是像Cerebras公司那樣,讓整個12英寸晶圓成為一個GPU。但這樣製造難度大,一個缺陷就要扔掉整個晶圓,不經濟,用途受限。但即便如此,Cerebras也離不開HBM和HBF,沒有內存,在推理時代就會很弱。那麼NVIDIA能否堆疊GPU呢?不能,因為太熱了,後面得裝冷卻器,無法堆疊。所以GPU有些被困住了的感覺。最近黃仁勛坐立不安,來韓國上電視、扔棒球、吃炸雞喝啤酒、見很多人,說明他並不安逸。其中一個原因就是,我認為GPU的技術成長幾乎停滯了。相反,AI計算機的成長和進化取決於內存。
主持人: 有說法是,實際運行的GPU只有10%?
金正浩: 是的。即使安裝了100萬個GPU,實際工作時間可能只有20%,甚至10%。為什麼?因為GPU需要從內存獲取數據才能計算並返回結果,但數據從內存(HBM/HBF)傳輸不過來。當ChatGPT快速吐出單詞時,每個瞬間都需要從HBM/HBF讀取數據、計算、再寫入,幾乎全部時間都花在讀寫上,GPU在等待。所以關鍵在於能否快速讀取、讀取多少,這就是需要HBM和HBF的原因。無論如何改進算法,GPU實際工作可能最多隻有30%,其餘時間在空轉。
主持人: 所以教授您主張,未來HBM或HBF內部會集成GPU功能,開啟新時代?
金正浩: 是的。既然HBM/HBF的數據讓GPU在等待,那不如我們自己計算。就好比在公寓一樓安裝GPU,數據坐電梯下來計算,整棟樓里解決所有事,不用去別的地方,省去了奔波時間。所以主張在HBM里放入CPU/GPU功能,甚至讓GPU「靠邊站」。當然不能讓GPU完全沒事做,要適當分工,讓它「一直保持渴求狀態」。這就是我所說的「Memory-Centric Computing」(以內存為中心的計算)。從HBM4開始,已經在朝這個方向做了。
主持人: 即使HBM/HBF里集成了GPU功能,因為沒有堆疊多個GPU,散熱問題應該不存在吧?
金正浩: 還是會有一點散熱問題。所以從HBM4開始,SK海力士和三星製造的產品性能可能會有差異,這和散熱有關——能否有效排出熱量。因為在一樓(內存層)集成了部分GPU功能,那裡太熱,內存就像坐在「暖炕」上,性能會下降,必須給暖炕降溫。誰能更好地冷卻,將決定HBM4及以後產品的性能差異,GPU也是如此。所以我們實驗室的想法是,既然一層太熱,不如把部分功能移到「屋頂」(頂層),在上面加裝冷卻塔,從頂部直接冷卻。這是我們的核心架構之一,目前在HBM5相關研究中,碩博士們正在進行這項研究,希望能大獲成功。
我們發表這些論文後,NVIDIA、AMD、三星、海力士都會看到,起初可能排斥,但發現沒有別的辦法,最終會採納。
主持人: 如果教授所說的HBM/HBF內部集成GPU的未來到來,甚至以後集成CPU,那三星電子和SK海力士應該會發展得更好吧?
金正浩: 是的,機會正在到來。「發展得更好」意味著掌握更多主導權,甚至可能超越NVIDIA。但要實現這一點,需要技術開發、投資、人才培養,以及良好的政策判斷和經營管理層的開放思維和正確判斷。管理層的判斷最重要。
主持人: 教授主張「即將進入內存時代而非GPU時代」,這似乎已經開始了。另外,最近GPU勢頭很猛,但也出現了NPU,NPU是什麼?
金正浩: 都是處理器,用於矩陣計算,都用於AI。GPU原本是GPGPU,TPU里也包含HBM,所以都離不開HBM、離不開內存。Gemini能寫文章、處理語言模型、畫畫,功能多樣;而有些晶片只擅長寫文章,為特定目的簡化,就是NPU。也有人叫LPU。它們都是AI所需的計算器,根據特殊用途做得更小、功耗更低、成本更低。國內有Rebellions、FuriosaAI、HyperExcel等公司,全球大約有十幾家做NPU的,但無論Rebellions還是FuriosaAI,為了高性能都必須使用HBM。
主持人: 最近FuriosaAI和Rebellions獲得了國民成長基金的大規模投資,這是要讓它們真正和NVIDIA一較高下。這兩家公司真有全球競爭力嗎?
金正浩: 我當時是評審委員之一。這個決策有這樣的考量:NVIDIA無法掌控全世界所有領域,NPU、TPU等肯定存在利基市場。比如沙烏地阿拉伯阿拉伯建數據中心,如果全部用美國產品,依賴度太高,所以可能將其中10%採用其他解決方案,韓國NPU企業可以成為候選。另外,韓國國內建設AI數據中心(可能需要百萬台設備),如果100%都用NVIDIA晶片,我們對海外的依賴度太高,需要培育本土企業。所以決定投資以培育國內企業。總體概括就是這樣。技術上也有其優點。
主持人: 教授您最近的研究中提出了「高帶寬SRAM(HBS)」的概念?
金正浩: 是的,這是我最近提出的新概念。像之前提到的,我提出概念,但要實現需要三星、SK海力士等公司的大量努力。這些概念往往在10年、20年後會產生重大影響。我提到過Cerebras,有巨大的GPU,美國也有叫LPU的晶片。它們為了自尊心或減少對HBM的依賴,在GPU內部集成了SRAM作為內存。SRAM比DRAM快約1000倍,但容量小。我研究了一下,無論是Cerebras還是LPU,都面臨SRAM容量不足的問題。據我了解,整個12英寸晶圓做成的Cerebras晶片,SRAM也只有44GB,而我認為至少需要400到440GB才有意義。
所以我的想法是:製造一個將整個12英寸晶圓鋪滿SRAM的晶片,然後再把它堆疊10層、12層或16層。這樣100GB就能變成1600GB,容量驚人。然後在這個晶圓級SRAM堆疊體上再放置GPU。速度是千倍之快,容量又足夠,這主意聽起來可行。所以我把這個晶圓級SRAM稱為HBS。我未來的夢想是:HBM、HBF、HBS都變成100層高的大樓,GPU放在最頂層,冷卻系統等也集成在一起,這種3D半導體結構將不可避免地成為未來AI計算機的架構。
這可能需要10年、20年甚至30年。其中最困難的技術之一就是供電。在HBS、HBM上面堆疊GPU,需要供應數千安培電流,電力供應網路設計將是最困難的,這將成為技術核心競爭力。SK海力士、三星、Micron、TSMC都一樣,其次是如何散熱,這是實現過程中的障礙。目前人們關注TSMC和三星誰在幾納米工藝上做得好、良率如何,但未來,對於包含HBS在內的3D AI計算機,如何供電、如何冷卻,將決定企業的生存。
主持人: HBS簡直是內存半導體領域的「黃政民」(比喻大腕)。
金正浩: 是「黃政民」沒錯。我10年前就聽說Cerebras用12英寸晶圓做GPU,當時心想「什麼?這能用在哪兒?」大概是國防AI吧。當時我還挺自大。但兩周前,這家公司在那斯達克IPO了,讓我改變了想法。還是有用途的。既然Cerebras晶片最大的弱點是內存不足,那就把它也堆疊起來。有一天早上我有了這個想法,讓學生畫了圖。最近開始談論HBF,等今年碩士新生入學,我打算讓他們開始以HBS作為碩博士論文研究方向。
主持人: 那SRAM由誰製造?
金正浩: 由代工廠製造,TSMC和三星電子都會做。
主持人: 今年三星和SK海力士的合計營業利潤據說在500到600兆韓元之間,這是現實的目標還是過於樂觀的展望?
金正浩: 我認為是現實的。我經常與三星和海力士的高管進行技術會議,感覺他們的眼神越來越亮。雖然他們不和我談具體的銷售額。現在HBM、HBF的一個重要特點是「定製化HBM」。以前是製造標準化產品,大量生產,客戶買多買少,價格波動,這叫「周期」。內存廠商不主導,而是由CPU廠商、微軟或電腦廠商決定購買數量,我們只能多生產一些觀望,如果客戶不買,庫存壓力就在我們身上,這就是「內存周期」。
但從HBM4開始,不僅集成GPU功能,另一個重要功能是HBM之間可以相互通信。以前只做GPU指令的事,現在主張它們之間也要溝通。未來,HBM之間可以競爭,把更多內存分配給表現更好的HBM。也就是說,它們內部形成組合,不給表現差的HBM向GPU傳遞數據的機會。總之,隨著這些算法、通信功能、GPU功能的加入,每個公司(谷歌、AMD、NVIDIA)對HBM的設計要求都不同,這就是定製化HBM。這樣在開發初期就簽訂了長期供貨協議(LTA),沒有訂單就不開始開發。
現在AI企業極度需要高性能HBM,所以排隊求購,市場變成了賣方市場,供方定價。這是一種範式轉變。
主持人: 到現在為止,我們與KAIST金正浩教授就半導體生態進行了對話。感謝您今天的分享。
金正浩: 謝謝。
來源:金色財經
發佈者對本文章的內容承擔全部責任
在投資加密貨幣前,請務必深入研究,理解相關風險,並謹慎評估自己的風險承受能力。不要因為短期高回報的誘惑而忽視潛在的重大損失。
暢行幣圈交易全攻略,專家駐群實戰交流
▌立即加入鉅亨買幣實戰交流 LINE 社群(點此入群)
不管是新手發問,還是老手交流,只要你想參與加密貨幣現貨交易、合約跟單、合約網格、量化交易、理財產品的投資,都歡迎入群討論學習!
- 讓加密貨幣幫你滾出年化30%現金流
- 掌握全球財經資訊點我下載APP
延伸閱讀
- Strategy買幣策略轉彎!授權出售12.5億美元比特幣、啟動20億美元庫藏股
- 比特幣市值蒸發1.3兆美元!分析師:真正底部恐還沒到
- 比特幣底部到了嗎?多空激辯後市走向、分析師警告或仍有「最後一跌」
- 比特幣暴跌背後真相曝!分析師揭BTC最大困境:三條賽道全面失勢
- 講座
- 公告
下一篇