《電子技術應用》
您所在的位置:首頁 > 可編程邏輯 > 業界動態 > 如何使用一個DSP block實現4個11位浮點型數據乘法運算

如何使用一個DSP block實現4個11位浮點型數據乘法運算

2018-08-18
關鍵詞: DSPblock INTELFPGA Arria10

  概述

  隨著深度學習的發展,為了解決更加抽象,更加復雜的學習問題,深度學習的網絡規模在不斷的增加,計算和數據的復雜也隨之劇增。INTEL FPGA具有高性能,可編程,低功耗等特點,為AI應用加速提供了一種靈活、確定的低延遲、高通量、節能的解決方案。Arria10INTELFPGA第一代集成IEEE754標準單精度硬浮點DSP block,可以為高復雜度的深度學習算法提供高精度,高能效的乘法運算。

  深度學習算法復雜度高,需要進行大量的乘法運算,如實現一個卷積核為5*5的特征提取,需要進行25*25次乘法運算,而隨著特征提取量的增加,乘法運算也將成倍的增長。因此乘法器資源是實現深度學習算法的重要評估資源,本文主要介紹如何基于Arria10的一個18*18的乘法器實現兩個11*11的浮點mini-fp運算,從而4倍提高DSP block資源。

  原理分析

  Arria10可變精度的DSP Block支持配置為兩個18*18或者18*19定點乘法器,進行18*18乘法運算時,如圖1所示,將輸入拆分為低6位,中6位,高6位,進行運算分析。

a.png

  圖1 18*18乘法器運算

  則對應的運算結果如下表所示:

0.png

  將中6位輸入全設為0,則可以得到對應的輸出結果如下表所示:

4.png

  當高6位及低6位為帶符號位的輸入數據時,進行符號位提取,則剩余的實際數據有效位為5位,因此低6位*高6位及高6位*低6位的乘法結果最高有效位均為10位,進行兩個結果的加法運算,可以保證結果在12-23位以內,不會對高6位*高6位乘法結果造成影響。因此Arria1018*18的乘法器支持進行符號位提取后的兩個6*6的乘法運算,圖2是對應的仿真結果,乘法結果對應延時2個時鐘周期。

1.png

  圖2 modelsim 仿真結果

  浮點型數據如圖3所示,包含符號位S,指數位E及尾數位M。

2.png

  圖3 浮點型數據組合

  進行浮點型數據乘法運算,如圖4所示。

3.png

  圖4 浮點型數據乘法

  需要進行指數相加,尾數相乘,乘法結果取整及指數的調整。11位的浮點型數據尾數及指數各占5位,因此進行乘法運算僅需要進行包含符號位6位的數據相乘及對應的處理即可。Arria10的DSPblock可支持配置為2個18*18乘法器,而一個18*18的乘法器可以實現兩個6*6的乘法運算,因此一個DSPblock可以實現4個11位浮點型數據mini-FP的乘法運算。


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 人妻精品久久久久中文字幕一冢本| 在线免费观看色片| 亚洲免费综合色在线视频| 精品第一国产综合精品蜜芽| 国产欧美在线视频免费| 亚洲精品乱码久久久久久蜜桃不卡| 538视频在线观看| 日韩中文字幕免费视频| 四虎影院最新域名| bbbbbbbw日本| 无人视频在线观看免费播放影院| 免费一级特黄特色大片在线| 高清国语自产拍免费视频| 国产香蕉一区二区三区在线视频| 久久精品国产亚洲AV水果派| 精品免费一区二区三区| 国产精品电影在线| 久久久久久不卡| 玉蒲团之天下第一| 国产最爽的乱淫视频国语对| 99精品热这里只有精品| 日韩人妻无码精品无码中文字幕| 免费观看无遮挡www的小视频| 2018国产大陆天天弄| 日本中文字幕乱理伦片| 他强行给我开了苞| 色欲aⅴ亚洲情无码AV| 在公车上忘穿内裤嗯啊色h文| 中文字幕一区二区在线播放| 欧美精品99久久久久久人| 国产乱码精品一区二区三| 羞羞漫画成人在线| 成人区人妻精品一区二区不卡网站 | 美女胸被狂揉扒开吃奶二次元| 在线国产一区二区| 两个人看的www免费高清| 欧美成人鲁丝片在线观看| 免费在线观看污视频网站| 麻豆国产精品有码在线观看| 国语自产精品视频在线看| 一二三四视频中文字幕在线看|