《電子技術應用》
您所在的位置:首頁 > 電子元件 > 業界動態 > 深度學習搞起來!對標英偉達Tensor Core,AMD推出Matrix Core

深度學習搞起來!對標英偉達Tensor Core,AMD推出Matrix Core

2020-11-17
來源:機器之心
關鍵詞: AMD GPU

  AMD 發布 Instinct MI100 加速器,它使用最新 Matrix Core 技術,是面向 HPC 和 AI 的新型加速系統。AMD 表示這是全球最快的 HPC GPU,也是首個超越 10 teraflops (FP64) 性能障礙的 x86 服務器 GPU。

微信圖片_20201117143945.png

  當前,GPU 已經成為深度學習訓練的標配,而針對深度學習中的 Tensor 操作,各大廠商在設計軟硬件時都會做特別優化,其中知名的就是英偉達的 Tensor Core。

  今日,對標英偉達 Tensor core,一直發展迅猛的 AMD 也推出了類似功能單元 Matrix Core。同時,基于 Matrix Core 技術,AMD 發布了新型 AMD Instinct MI100 加速器,據稱是全球最快的 HPC GPU 和首個超越 10 teraflops (FP64) 性能障礙的 x86 服務器 GPU。

  據 AMD 官方介紹,AMD Instinct MI100 GPU 配備了全新 AMD CDNA 架構,使用第二代 AMD EPYC 處理器,是面向 HPC 和 AI 的新型加速系統。

  在性能上,MI100 為 HPC 提供了高達 11.5 TFLOPS 的 FP64 峰值性能,為 AI 和機器學習提供了高達 46.1 TFLOPS 的 FP32 Matrix 峰值性能。

  與 AMD 的上一代加速器相比,MI100 憑借新的 AMD Matrix Core 技術,為 AI 訓練提供了近 7 倍的 FP16 理論峰值浮點性能提升。

2.png

3.png

  AMD Instinct MI100 為 HPC 和 AI 提供優秀的性能(圖源:https://www.amd.com/zh-hans/products/server-accelerators/instinct-mi100)

  MI100 的具體規格參見下表:

4.jpg

  AMD 數據中心 GPU 和加速處理公司副總裁 Brad McCredie 表示:「AMD Instinct MI100 的推出,標志著 AMD 朝著百億億級計算邁出了重要的一步。這款新型加速器專為科學計算中重要的工作負載打造,結合 AMD ROCm 開放軟件平臺后,能夠為科學家和研究人員在 HPC 中的工作提供堅實的基礎。」

  此外,AMD 還推出了 ROCm 4.0。ROCm 開發者軟件平臺旨在為百億億級計算提供基礎,包括編譯器、編程 API 和庫。此次推出的 ROCm 4.0 針對基于 MI100 的系統進行了優化,將編譯器升級為開源版本,并支持 OpenMP 5.0 和 HIP。經過 ROCm 4.0 優化,PyTorch 和 Tensorflow 框架可以基于 MI100 實現更高的性能。

  AMD Instinct MI100 加速器的特性

  以下是 AMD Instinct MI100 加速器的關鍵能力和特性:

微信圖片_20201117143958.png

  AMD Instinct MI100 的關鍵特性一覽表(圖源:https://www.amd.com/system/files/documents/instinct-mi100-brochure.pdf)

  全新的 AMD CDNA 架構:該架構專為 AMD GPU 適應百億億級計算時代而打造,是 MI100 加速器的核心,能夠提供卓越的性能和能效。

  適應 HPC 工作負載的 FP64 和 FP32 頂尖性能:峰值 FP64 和峰值 FP32 的性能分別達到 11.5 TFLOPS 和 23.1 TFLOPS,行業領先。

  全新的 Matrix Core 技術:適合多種單精度和混合精度矩陣運算(如 FP32、FP16、bFloat16、Int8 和 Int4)的超強性能,從而提升 HPC 和 AI 的收斂性能。

  第二代 AMD Infinity Fabric 技術:Instinct MI100 提供大約二倍的 PCIe 4.0 接口 P2P 峰值 I/O 帶寬,每塊 GPU 配置三條 AMD Infinity Fabric 總線,總帶寬高達 340 GB/s。在服務器上,MI100 GPU 可以配置兩個全連接 quad GPU hive,每個提供高達 552 GB/s 的 P2P I/O 帶寬,從而實現快速數據共享。

  超快 HBM2 內存:32GB 高帶寬 HBM2 內存,時鐘速率為 1.2 GHz,可以提供超高的 1.23 TB/s 內存帶寬,以支持大型數據集,并消除數據進出內存的瓶頸。

  支持業內最新的 PCIe Gen 4.0:支持最新的 PCIe Gen 4.0 技術,提供高達 64GB/s 的 CPU 到 GPU 理論數據傳輸帶寬。

  原文鏈接:https://ir.amd.com/news-events/press-releases/detail/981/amd-announces-worlds-fastest-hpc-accelerator-for

  Amazon SageMaker 1000元大禮包

  ML訓練成本降90%,被全球上萬家公司使用,Amazon SageMaker是全托管機器學習平臺,支持絕大多數機器學習框架與算法,并且用 IDE 寫代碼、可視化、Debug一氣呵成。

  現在,我們準備了1000元的免費額度,開發者可以親自上手體驗,讓開發高質量模型變得更加輕松。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 国产又大又粗又长免费视频| 成人免费高清完整版在线观看| 伸进大胸老师里面挤奶吃奶的频| 黑人边吃奶边扎下面激情视频 | 亚洲系列第一页| 陪读妇乱子伦小说| 国产精品无码av天天爽| xxxxx免费| 日产精品一二三四区国产| 亚洲制服丝袜一区二区三区| 男女混合的群应该取什么名字 | 中国在线观看免费的www| 最近免费韩国电影hd视频| 亚洲网站免费看| 亚洲av综合色区无码一区爱av| 色噜噜狠狠一区二区三区| 国产特黄特色一级特色大片| freehd182d动漫| 无人区1080在线完整免费版| 亚洲AV成人无码网站| 欧美黑人性暴力猛交喷水| 午夜网站在线播放| 麻豆一区二区99久久久久| 国产精品美女自在线观看免费 | 国产交换配乱婬视频| 久久国产精品免费| 欧美黄色片网址| 免费黄色网址入口| 菠萝菠萝蜜在线免费视频| 国产精品一区12p| 99久久精品国产免费| 成人免费av一区二区三区| 久久精品99国产精品日本| 欧美性猛交xxxx乱大交3| 人妻丰满熟妇AV无码区免| 精品视频国产狼友视频| 国产免费小视频在线观看| 欧美性另类高清极品| 国产综合无码一区二区辣椒| a级毛片视频免费观看| 性做久久久久久免费观看|