10月16日,在北京舉行的2018XDF賽靈思開發者大會上,浪潮聯合賽靈思宣布推出全球首款集成HBM2高速緩存的FPGA AI加速卡F37X,可在不到75W典型應用功耗提供28.1TOPS的INT8計算性能和460GB/s的超高數據帶寬,適合于機器學習推理、視頻轉碼、圖像識別、語音識別、自然語言處理、基因組測序分析、NFV、大數據分析查詢等各類應用場景,實現高性能、高帶寬、低延遲、低功耗的AI計算加速。
浪潮集團副總裁李金在XDF大會做主題演講
F37X是浪潮專為AI極致性能設計的尖端FPGA加速卡,它采用Xilinx Virtex UltraScale 架構,提供285萬個系統邏輯單元和9024個DSP單元,INT8計算性能達到了28.1TOPS,集成8GB HBM2高速緩存,帶寬達460GB/s,相比單DDR4 DIMM提升20倍。當AI計算模型尺寸小于HBM2容量時,可全部預先載入高速緩存之中,消除了外部讀寫帶來的數據傳輸延遲并提高處理速度,使AI計算完全放到片上成為可能。性能數據顯示,浪潮F37X在AI圖像識別實時推理場景,基于GoogLeNet深度學習網絡模型,當BatchSize=1時性能高達8600 images/s,是CPU性能的40倍。F37X典型應用功耗僅為75瓦,性能功耗比高達375Gops/W。此外,F37X板載24GB DDR4內存及雙端口100Gbps高速網絡接口。F37X設計為全高半長PCI-E 3.0板卡,緊致的尺寸可使得單臺AI服務器支持更多加速卡設備,從而提供極限計算與通信性能。
全球首款集成HBM2的FPGA AI加速卡F37X
F37X可支持C/C 、OpenCL和RTL三種主流的編程語言開發環境。相應SDx工具套件內含SDAccel?、Vivado?及SDK工具,應用已有的OpenCV、BLAS、Encoder、DNN、CNN等加速庫,實現對主流深度學習框架如Caffe、TensorFlow、Torch、Theano等的支持,覆蓋機器學習推理、視頻圖像處理、數據庫分析、金融、安全等典型AI應用領域,提供強大的生態支持,具備更加出色的易編程性,可靈活快速開發和遷移不同的AI定制算法應用,在軟件生產力上實現了質的飛躍。
浪潮集團副總裁李金表示:“AI正以前所未有的速度重構產業創新,AI算法將不斷快速迭代,線上推理將成為AI計算的主要場景。浪潮一直致力創新FPGA軟硬件技術,幫助客戶持續獲得領先的AI計算競爭力。浪潮F37X加速卡將為全球用戶提供快速可定制、實時高性能、高密低功耗的先進的FPGA解決方案,加速AI應用的線上部署。”
賽靈思公司數據中心銷售副總裁FreddyEngineer表示:“浪潮因產品執行和創新而享譽全球。浪潮將為客戶提供搭載Xilinx加速卡的服務器,我們為此而自豪。我們非常高興能成為浪潮的開發合作伙伴,聯合推出突破性產品F37X,它通過HBM2提供前所未有的內存帶寬,將加速數據分析、AI和需要最低延遲數據訪問的工作負載。”
浪潮是全球領先的AI計算力廠商,從計算平臺、管理套件、框架優化、應用加速等四個層次致力于打造敏捷、高效、優化的AI基礎設施。浪潮幫助AI客戶在語音、圖像、視頻、搜索、網絡等方面取得數量級的應用性能提升。據IDC《2017年中國AI基礎架構市場調查報告》顯示,浪潮AI服務器市場份額達57%高居第一。