8 月 26 日消息,科技媒體 WccfTech 昨日(8 月 25 日)發布博文,報道稱在 Hot Chips 2025 大會上,谷歌詳細披露第七代 TPU 架構“Ironwood”超級計算平臺。
援引博文介紹,谷歌于今年 4 月官宣第 7 代 TPU 架構,代號為 Ironwood,號稱其性能是當前最強大超級計算機的 24 倍。
本次披露主要聚焦單個 Superpod 的硬件構成與架構設計。相比 2022 年的 TPU v4(4096 芯片、32GB HBM、275 TFLOPs)和 2023 年的 TPU v5p(8960 芯片、95GB HBM、459 TFLOPs),Ironwood 在核心規格上大幅躍升。
單個 Ironwood Superpod 集成 9216 枚芯片,每片配備 192GB、帶寬 7.4TB/s 的高帶寬存儲,峰值算力高達 4614 TFLOPs,意味著其單芯片性能較 TPU v4 提升超過 16 倍。
每四顆芯片組成一塊 PCBA 主板,16 塊主板構成一個機架,共 64 芯片節點,谷歌采用 InterChip Interconnect(ICI)技術,將多達 43 個 64 芯片模塊互連,構建出擁有 1.8PB/s 網絡帶寬的集群。
在物理布局上,Ironwood 沿用過去三代的 3D Torus(立方環網)拓撲,每個邏輯單元為 4×4×4 節點陣列,即 64 芯片,封裝于單個機架。
一個 Superpod 包含 144 個機架,還配備光學交換機機箱以實現跨模塊互連,以及用于液冷的冷卻分配單元(CBU)機架,互連方面為提高靈活性與可擴展性,采用 PCB 走線、銅纜和光纖的混合方式。
在機架設計上,頂部設有泄漏檢測盤以監控液冷系統,下方是供電模塊,具備兩路電源域,將 416V 交流電經整流轉換為直流電。整套系統支持液冷散熱,滿載運行功率可超過 100kW。
注:
· TPU(Tensor Processing Unit)張量處理單元:谷歌專為機器學習任務設計的專用芯片,優化矩陣運算性能。
· Superpod,就是一組連續的 TPU,通過專用網絡組合在一起。
· HBM(High Bandwidth Memory)高帶寬存儲:一種集成在芯片附近的高速顯存,顯著提升數據傳輸速率。
· TFLOPs(Tera Floating Point Operations per Second)萬億次浮點運算 / 秒:衡量芯片浮點運算性能的指標。