《電子技術應用》
您所在的位置:首頁 > 模擬設計 > 業界動態 > AMD Zen 5 CPU架構內核解析

AMD Zen 5 CPU架構內核解析

IPC性能提升了16%!
2024-07-16
來源:芯智訊
關鍵詞: AMD Zen5

7月15日消息,AMD近日在美國洛杉磯舉行的技術日活動中,介紹了其全新的Zen 5 CPU架構,將會帶來平均16%的每時鐘指令數(IPC)性能提升,相關處理器產品將于7月底上市。

在今年6月初的Computex 2024展會上,AMD正式發布了基于全新的Zen5架構的Ryzen 9000系列桌面處理器(Granite Ridge)和面向筆記本電腦的Ryzen AI 300系列AI PC處理器(Strix Point)。

其中,Ryzen 9000系列當中的旗艦產品——Ryzen 9 9950X配備16核心32線程,170W TDP,最高主頻5.7 GHz。而Ryzen AI 300系列的旗艦產品——Ryzen AI 9 HX 370的CPU為12核心24線程,包括4個Zen 5 內核和8個Zen 5C 內核,每個核心1MB二級緩存,三級緩存為24MB,最高主頻5.1GHz。GPU不但升級架構,CU單元數量也從12個增至16個,命名為“Radeon 890M”。NPU算力則提升到了50TOPS,增加了2倍有余。

根據此前AMD公布的數據顯示,與英特爾Core i9-14900K相比,AMD旗艦16核心Ryzen 9 9950X在游戲性能測試中的速度快4%到23%。在生產力性能測試中,9950X顯示出更大的優勢,比英特爾Core i9-14900K快7%至56%。同樣Ryzen AI 300系列相比上代產品也帶來的很大的性能提升。

當然,制程工藝、CPU核心數量、緩存容量和主頻上的提升,都對于其CPU的性能提升帶來了不小的助力,但是其中關鍵的性能提升則是來源于Zen 5 內核架構的提升。

Zen 5 內核帶來了平均16%的IPC性能提升

據介紹,其 Zen 5 內核擁有 6 個 ALU,數量是上一代的 3 倍,采用了 48KB 的 12 路一級緩存,在浮點運算以及最大帶寬上均是上代的 2 倍,并且Zen 5內核也同樣支持完整版的 AVX-512 指令,從而在一些專業應用上有事半功倍的作用。得益于這些方面的提升,Zen 5的IPC性能比上一代的Zen 4 內核高出了10%-35%,平均提升了16%。

1.jpg

據AMD首席技術官Mark Papermaster介紹,Zen 5內核的最大改進之一是其前端,在其IPC整體性能提升當中的占比為39%。

具體來說,AMD已經擴大了前端,允許每個周期進行更多的分支預測——這是現代CPU內核性能的主要貢獻者——并實施了雙解碼管道以及i-cache和op-cache改進,以遏制延遲并提高帶寬。

2.png

Zen 5 這個更寬的前端與一個更大的整數執行引擎配對,該引擎現在每個周期中最多支持8條指令——調度和報廢,而上代的Zen 4 只有6條指令。AMD 還將算術邏輯單元 (ALU) 的數量從 4 個增加到 6 個,還有3個乘法器,并實施了更統一的調度程序,以提高執行效率。

3.png

為了減少錯誤預測增加的可能性,AMD還將Zen 5的執行窗口延長了約40%。“它的作用是帶來新的性能水平,因為它與這些前端進步相結合......它允許我們使用這些指令,并利用通過管道向我們提供的改進預測,“Papermaster 解釋道。

Zen 5 的 IPC 性能增長當中,約 27% 可歸因于后端數據帶寬的增加。與上一代相比,AMD 將 L1 數據緩存從 32KB 提升到 48KB,并將 L1 和浮點單元的最大帶寬增加了一倍。

4.png

關鍵的一點是,AMD不僅對分支預測器或執行引擎進行了優化,還試圖平衡內核的每個元素,以避免瓶頸或增加延遲。其結果是,器核心可以比前幾代更快地消化更多指令。

Zen 5 內核所帶來的最大的IPC提升,在于其改進了AVX-512指令的實施,對于AVX-512矢量擴展進行了重新設計,以提供完整的512位數據路徑,使得其在AVX-512 矢量擴展的工作負載中表現更為出色。

5.png

雖然 Papermaster 聲稱 Zen 5 現在可以運行完整的 AVX-512 工作負載而不會受到頻率損失,但這些指令在歷史上一直運行得非常熱。這在臺式機或工作站上沒什么大不了的,但對于散熱空間有限的筆記本電腦來說并不理想。所以對于“Strix Point”系列移動芯片,AMD則是堅持使用“double-pumped” AVX-512來實現——可能會針對每瓦性能和散熱限制進行優化。相比之下,上代的Zen 4 則是“double-pumped” AVX-256。

此外,Papermaster 還強調了了AVX-512 工矢量擴展在 CPU 上運行AI工作負載的潛力。在機器學習方面,AMD聲稱單核Zen 5 性能比Zen 4 提高了32%,在AES-XTS 加密算法性能上也提升了35%。特別是在其移動芯片方面,AMD強調了在每個領域運行機器學習的概念,而不僅僅是在集成GPU或NPU上。

AMD表示 Zen 5 架構將會應用于各個領域,除了桌面與移動處理器之外,包括 EPYC 霄龍處理器以及嵌入式處理器等都將采用 Zen 5 架構,從而讓企業部署更加得心應手。

在AMD的技術日披露中,其Zen 5和緊湊型Zen 5C 內核在功能方面在架構上基本保持相同,只不過較小的 Zen 5C 內核可以以較低的頻率換取更高的性能密度。

據介紹,首批基于 Zen 5 內核的處理器系列(Ryzen 9000系列和Ryzen AI 300系列處理器)將于 7 月 31 日上市。但是基于Zen 5 內核的數據中心處理器可能必須等待更長的時間才能到達。

根據之前曝光的信息顯示,在第5代 Epyc服務器處理器,預計將會采用臺積電3nm制程,并將具有192個CPU內核和384個線程。與此同時,頻率優化的“Turin”可能會有128 個內核和256 個線程。

競爭白熱化

在Zen 5 內核推出之際,AMD 正面臨多年來最激烈的競爭。因為高通公司推出了一款強大的基于 Arm 架構的Windows筆記本電腦芯片,而英特爾也準備在其至強和酷睿產品系列中推出一系列改進的CPU。

在客戶端領域,高通具有45TOPS NPU算力的驍龍處理器使其在微軟的Copilot + AI PC推動中處于領先地位。AMD的具備50TOPS NPU算力的Ryzen AI 300系列則希望帶來更多競爭優勢。但是,英特爾即將上市的Lunar Lake則具有48TOPS NPU算力,AI綜合算力更是高達120TOPS。顯然,AMD的Ryzen AI 300在與英特爾Lunar Lake的競爭當中,可能并沒有多少優勢。

在數據中心領域也有類似的情況,隨著英特爾 144 核 Sierra Forest 和即將推出的 128 核 Granite Rapids Xeon 6 平臺的推出,AMD在該市場也面臨更加激烈的競爭。英特爾Xeon 6系列除了架構轉向了全大核和全小核,也轉向新的小芯片架構,并且這些芯片也升級到了Intel 3 制程工藝。

與此同時,越來越多的云服務提供商也在自研基于Arm 架構的定制芯片,來處理其超大規模工作負載。比如亞馬遜的Graviton 現在已經是發展到了第四代,并普遍可用。此外,谷歌、阿里云、百度、微軟、Meta也都已開始部署或研發自己的Arm架構服務器芯片。


000.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 国产一区风间由美在线观看| 大陆熟妇丰满多毛XXXX| 亚洲国产欧美另类va在线观看 | 国产精品va在线观看无码| 一本色综合网久久| 日本高清免费中文字幕不卡| 亚洲综合精品香蕉久久网| 色吊丝永久性观看网站| 国产清纯91天堂在线观看 | R级无码视频在线观看| 日批视频app| 亚洲av无码一区二区三区鸳鸯影院| 狠狠色综合TV久久久久久| 国产99在线|亚洲| 久碰人澡人澡人澡人澡人视频| 在线综合亚洲欧美自拍| 不卡视频免费在线观看| 日韩在线不卡免费视频一区| 亚洲日本一区二区三区在线| 窝窝人体色www| 国产99精华液| 韩国伦理片年轻的妈妈| 国产精品久久久久久久久99热 | 日本肉漫在线观看| 亚洲丝袜第一页| 毛片免费观看的视频| 女人l8毛片a一级毛片| 久久亚洲精品成人综合| 欧美伊久线香蕉线新在线| 人人澡人人澡人人看添欧美| 美女视频内衣脱空一净二净| 国产成人一区二区在线不卡| 2021国产精品视频网站| 天堂√最新版中文在线天堂 | 看看镜子里我是怎么c哭你的| 国产乱码精品一区二区三区四川人| 午夜伦伦影理论片大片| 国产麻豆剧果冻传媒免精品费网站| 一区二区三区在线观看视频| 拨牐拨牐x8免费| 久久国产热这里只有精品|