隨著英偉達在最新的財報會議中明示,不同的國家都在嘗試建立屬于自己的 AI 算力,這一暗流下的激烈角逐已經完全走向臺前。
在這一場國家級、企業巨頭之間的競爭中,站在最前排的就是大模型和大模型的算力發動機 GPU。
從今年的 Sora、Claude3、GPT5 的態勢來看,大模型的智力涌現并未有絲毫放緩的跡象;這也使得國產大模型的追趕,眼看要縮小的差距又被無情的拉大,但算法的半透明和原理的公開,總歸讓這場競賽不至于被套圈太多。
雖然 GPU 龍頭英偉達股價一飛沖天,但攪局者的動力也有增無減,AMD 作為二供被寄予了厚望,谷歌自研 TPU 也被不少人看好;而國產 GPU 選手華為昇騰、寒武紀、海光、沐熙、壁韌等也在嘗試形成自己的閉環。
但在更為隱秘的戰場,HBM(高帶寬內存)顯然是基本被忽視的關鍵一環。
01
大模型和 GPU 是明戰,HBM 則是暗戰
如果因循最基本的原則,從 AI 算力出發,我們知道制約單芯片能力的最大瓶頸有三個,分別是:GPU、先進制程(含 CoWoS 先進封裝),以及 HBM。
其中 GPU 和先進制程是一體兩面的關系,優秀 GPU 企業如英偉達設計出來 GPU 之后,還需要利用臺積電的先進制程進行制造,再利用臺積電、日月光的先進封裝技術 CoWoS 進行最后的合封,這一點在 2023 年 CoWoS 產能奇缺的時候,已被市場刨根問底。
而在同一顆 AI 芯片上的顯存顆粒模組 HBM,作為與先進制程同等重要的存在,但到的關注顯然不夠。這一產品基本完全被韓國的海力士和三星壟斷,合計占市場份額的 90% 以上,絲毫不比 GPU 和 CoWoS 競爭格局差,而高度壟斷,在這逆全球化的背景下,隱含的就是高供應鏈風險。
HBM 也是 AI 芯片中占比最高的部分,根據外媒的拆解,H100 的成本接近 3000 美元,而其中占比最高的是來自海力士的 HBM,總計達到 2000 美元左右,超過制造和封裝,成為成本中最大的單一占比項。
雖然 HBM 非常昂貴,但隨著 AI 基礎算力需求的大爆發,草根調研顯示當前 HBM 仍是一芯難求,海力士和三星 2024 年所有的產能都已經完全被預定,行業的供需失衡可能在 2025 年也仍無法得到有效的緩解??赡軓娙缬ミ_,也需要思考自己的 HBM 供應鏈是否足夠安全。
這一重大的產業趨勢,自然也被存儲芯片大國韓國了如指掌。
經過一段時間的醞釀,2024 年初,韓國企劃財政部正式公布了《2023 年稅法修正案后續執行規則修正案草案》,將 HBM 等技術指定為國家戰略技術,進一步擴大稅收支持,在這一法案的支持下,三星電子、SK 海力士等中大型企業可享受高達 30% 至 40% 的減免。
考慮到韓國的大企業所得稅一般在 25%,這么大力度的減免,相當于給了韓國的 HBM 產品直接額外賦予了接近 10% 的價格優勢。當前韓國的存儲芯片企業海力士和三星,在 HBM 產品的產能和技術上,本來就處于斷檔式領先,即使其他追趕者能夠做出來產品,考慮到海力士和三星天然的價格屠夫的歷史形象,這將使得追趕者大概率始終陷入技術落后、價格高企的惡性循環中。
當然,韓國目前仍然是小大小鬧,還暫時沒有將 HBM 出口進行管制,或者進行相關的技術限制。但是翻看最近的歷史,我們不得不對此事提起十二分的關注。
2022 年 10 月,美國限制中國先進制程的發展,從設備、技術到人才實現全方面圍堵,使得原本進步飛速的國產先進制程舉步維艱。
2023 年 10 月,美國限制英偉達等美國企業向中國出口超過一定算力和帶寬的 GPU 芯片,直接對國產大模型實施了釜底抽薪式的打擊。
如果未來對 HBM 的限制變嚴格,那么就意味著我國在 AI 算力的三要素—先進制程、GPU 和 HBM —中,將陷入全方位的被動局面。
所以我們才說,上一輪最值得關注 HBM 的時間是十年前它被發明的時候,其次就是現在。
02
HBM 的昨天、今天和明天
1. 一種特殊類型的存儲芯片,可以理解為 DRAM 的 3D 版本
存儲芯片是最大的芯片品種。為了滿足不同場景的存儲要求,又被進一步的分為 SRAM、DRAM、NAND、NOR 等等,其中市場空間最大最為重要的是 DRAM 和 NAND,也就是業內人士常說的大宗品存儲,全球的市場空間都是接近 1000 億美元。
DRAM 對智能設備的運行速度起到與主控芯片一樣的決定性作用,對于普通消費者都能接觸到的手機為例,主控芯片和內存(即移動端 LPDDR DRAM)就是最重要的兩顆芯片。HBM,正是 DRAM 中的一個分支品種,主打高性能。
根據行業協會的定義,DRAM 可以分為三種:1)主要用在電腦、服務器中的標準 DDR,也就是常說的內存條;2)手機和汽車等移動終端領域的 LPDDR 系列;3)用在數據密集型場景的圖形類 DDR,HBM 正是在這一分類下。
所以,HBM 是脫胎于普通的 DRAM 的升級產品,基于 3D 堆棧工藝(使用 TSV 技術將多個 DRAM 芯片堆疊起來,在增加帶寬的同時,實現芯片間的高速通信和低功耗),可以實現更高的內存帶寬和更低的能耗,。
2023 年之前,雖然上述三種 DRAM 產品中,HBM 在傳輸速度、容量和功耗方面都具備明顯的優勢,但高于普通 DRAM 數倍的價格,使得對 HBM 需求一直都是名氣沒輸過、銷售沒贏過的尷尬存在。
圖:存儲芯片 DRAM 進一步分類,方正證券
但 AI 大模型的出現,使得 HBM 找到完美的應用場景。
眾所周知,大模型的智力涌現,依托于 Scaling laws 指導下的大力出奇跡,大模型對數據量和算力有著近乎無上限的需求,而算力的發動機 GPU 和存儲池 HBM,意外成為最大的受益者。
傳統帶寬的標準類 DDRDRAM 和移動類 LPDDR DRAM 顯然已經完全無法滿足 AI 芯片的需求,而立體堆疊的 HBM,它相對普通的內存帶寬可以提升數倍,而功耗反而更低,卻完美契合大模型的要求。
所以我們可以看到,在 AI 場景中,英偉達的 GPU 芯片不再是單獨售賣:從流程上,英偉達首先設計完 GPU,然后采購海力士的 HBM,最后交由臺積電利用 CoWoS 封裝技術將 GPU 和 HBM 封裝到一張片子上,最終交付給 AI 服務器廠商。最終產品結構正如海力士的宣傳材料展示的一樣。
可以說,英偉達、臺積電、海力士,這三家公司共同構成了全球 AI 算力基座的鐵三角。
2.AI 爆發帶來巨大的增長空間
從配角到主角的 HBM,也隨著 AI 的爆發也迎來屬于自己的廣闊舞臺。
在 AI 沒有爆發之前,市場預測全球 HBM 將平穩增長至一個 100 億美元的市場。但是隨著 2023 年大模型的橫空出世,HBM 的市場中樞預測被快速拔高。
根據市場機構測算,2023 年 HBM 市場規模為 40 億美元,預計 2024 年增長至 150 億美元,到 2026 年增長至接近 250 億美元,年復合增速高達 80% 以上。這一測算也與海力士的估算匹配上,2023 年 11 月,海力士 CEO 表示,預計到 2030 年,海力士每年 HBM 出貨量將達到 1 億顆,隱含產值規模將接近 300 億美元,假設屆時海力士市場份額為 50%,則整個市場空間將在 500 億美元左右。
屆時,HBM 將從配角,正式成為存儲芯片中最搶眼的主角。
圖:全球 HBM 市場規模預測(AI 浪潮之前),方正證券
3. 科技巨頭的縮圈游戲
與 AI 算力中的其他要素一樣,HBM 是一個科技難度極高的產品,典型特征是重資本投入和高技術含量。
做 HBM,首先就要求芯片企業能做出一流的 DRAM,然后在這個 DRAM 芯粒的基數上做 3D 的堆疊。經過幾十年的發展競爭,DRAM 已經有極高的技術門檻,其制程已經微縮到極限,雖然叫法上略有不同,但整體與邏輯芯片差別不大,最先進的 DRAM 都離不開 EUV 光刻機的加持;同時還非常燒錢,投資金額極高,海力士每年資本開支超百億美元。所以,當前 DRAM 已經基本被韓國三星、海力士以及美國美光所壟斷。
而從 DRAM 到 HBM,拋開更高的資本開支不談,還新增三大工藝難點:分別是 TSV、MR-MUF、混合鍵合 Hybrid Bonding。比如 TSV 技術,在維持較低的單 I/O 數據速率的情況下大幅提升了位寬進而獲得了遠優于 GDDR 的總帶寬表現。本文不就技術細節進行展開,這一難度就相當從 2D 電影進階到 3D 電影,完全是另一個維度的競爭。
直接衡量大家技術水平的,簡單可以看堆疊層數。根據了解到的最新行業動態:為配套英偉達最新的 H200,2024 年下半年三大存儲廠將推出 36GB 版本的 HBM3e 或為 12 層堆疊。
對于追趕者而言,靶子已經固定在那兒,只是難度著實不小。
03
HBM 背后的國力之爭
我們判斷,從 2024 年起,HBM 將繼 GPU 之后成為各個國家在算力競爭的關鍵。
毫無疑問,目前韓國海力士和三星遙遙領先。哪怕美國在這個領域也是落后的,他們本土的代表性公司美光科技已奮起直追。而中國國內的大宗存儲尚處在追趕狀態,所以 HBM 的落后自然也就更多,也更為急迫。
1. 韓國雙子星閃耀:海力士的不放棄功不可沒
前文提到,HBM 是基于 DRAM 的 3D 形態,而 DRAM 的全球霸主三星卻在 HBM 這一細分品類上處于落后狀態,而海力士卻是壟斷者的存在,這得益于公司對 HBM 技術的不離不棄。
早在 10 年前的 2013 年,海力士就首次制造出 HBM,并被行業協會采納為標準。2015 年,AMD 成為第一個使用 HBM 的客戶。但在此之后,HBM 由于價格高昂,下游根本不買單,甚至一度被認為是點錯了科技樹。
但海力士死磕這個方向,并沒有放棄。在 2015-2022 年,雖然并沒有什么突出客戶,海力士仍然對 HBM 產品進行了多達 3 次技術升級,絲毫不像對待一個邊緣產品的待遇。
最終,憑借著 2023 年至今的 AI 浪潮,海力士的 HBM 一芯難求,從無人問津到一飛沖天,10 年的堅守終于換了回報。在低迷的韓國股市中,海力士股價也一騎絕塵,實現翻倍,成為跟上全球 AI 浪潮的唯一一家韓國公司。
另一方面,內存領域的霸主三星,得益于在 DRAM 上的深厚積累,以及并不落后的技術儲備,迅速崛起成為 HBM 排名第二的玩家。
2016 年三星開始大規模量產 HBM。落后于海力士 3 年;而根據公司最新進展,三星已經于 2023 年實現了 HBM3 的量產出貨,而將在今年上半年推出 HBM3E,而且規劃 2025 年實現 HBM4 的量產。根據這一規劃,三星與海力士的差距已經縮小到半年左右,而差距有望于 2025 年被完全消弭。
三星除了有 DRAM 的底氣之外,由于 HBM 當中包含部分邏輯芯片的電路,因此三星電子依托于自有的邏輯晶圓廠,確實具備彎道超車的比較優勢。而且同為韓國公司,直接挖相關人才也更為容易。
毫無疑問,在 HBM 領域起了個大早的韓國,也絲毫沒有放松,還在朝前一路狂奔。
2. 美國獨苗苦苦支撐,但猶可追
美國公司在 HBM 的競賽中落后似乎是命中注定的。由于存儲芯片行業周期性極強,資本開支又是無底洞,已經逐漸被美國企業放棄,比如當年的存儲芯片龍頭英特爾早已完全退出存儲芯片市場,轉而增加了對韓國的依賴。
好在美國還剩最后的獨苗美光科技。在存儲這個刺刀見紅的嗜血賽道上,它的生存之道是 " 茍住 "。為了避免出現重大損失,美光一直在研發策略上堅持不做首發者,而更傾向于采取跟隨戰術,這樣能夠避免高昂的研發投入和可能打水漂的資本開支。
美光開始研發 HBM 的時間相對較晚,現在主流的 HBM3 上,美光的進度較海力士和三星落后半年以上。半年差距看似不大,但在 AI 硬件軍備競賽中,時間就是生命,大家為了保證大模型的領先,都爭相上最先進的算力產品,用最新的卡、最大帶寬的光模塊和最優質的 HBM,因此晚半年推出,就代表著整個市場的錯失,所以美光在 HBM 的份額低到只有個位數。
為了實現彎道超車,美光已經開始挖海力士和三星的核心人才,同時開啟多代產品的并行研發。公司放衛星的表示,將在 2024 年年底實現 HBM3E 的量產,如果屆時完成,將使得其與韓國巨頭的技術差距明顯縮小。此外,公司規劃在 2028 年量產 HBM4E ,將每個堆棧的容量提升到 48GB 至 64GB。
3. 中國突圍路在何方?
美國尚存獨苗,中國的 HBM 行業尚處 0 到 1 的階段,要補的課更多。
目前,中國企業在 HBM 產業鏈上的存在感甚至還要落后于先進制程與 GPU。如果說 GPU 只是人優我差的問題,HBM 則是人有我無的問題。
雖然 A 股已經對 HBM 進行了一輪又一輪的炒作,但不得不承認的客觀現實是,國內到現在無法量產 HBM,這成為國內自研 AI 芯片的重大隱憂,因為 GPU 需要和 HBM 利用 CoWoS 工藝封裝在一起,國產的 GPU 和 CoWoS 工藝都已經解決了有沒有的問題,已經進入量產爆發階段,而 HBM 還遙遙無期。
不同于境外市場要么押注龍頭海力士,要么押注能追趕上的美光,這種簡單的選擇題。A 股對 HBM 的投資邏輯演化成兩條:
參與全球產業鏈。選擇能夠參與到全球 HBM 供應鏈中的企業,比如做材料、代銷和封測的企業,如雅克科技、神工股份、太極實業、香農芯創等等。
選擇相信國產化能夠成功。國內具備大宗 DRAM 能力的企業長鑫、晉華均未上市,因此選擇能夠可能在 HBM 封裝上面能夠發揮作用上市公司,如通富微電、興森科技、甬夕電子、長電科技等。
國產 HBM 正處于 0 到 1 的突破期;考慮到海外的貿易保護主義抬頭,可能靠自己是一條不得不走的路只能靠我們自己。
時間就是生命,但由于在 DRAM 領域的落后,一家企業去主導 HBM 的突破顯得更加困難。從產業鏈合力的角度,更有望突破,HBM 顯然需要存儲廠、晶圓代工廠、封測廠的通力合作。根據最新的產業信息,到 2026 年我國將具備量產 HBM 的能力,但這一速度顯然還是有點跟不上日新月異的大模型需求。
也就是說,現在,留給 HBM 中國隊的時間唯 " 緊迫 " 二字。