《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于NOR Flash的卷積計算單元的設計
基于NOR Flash的卷積計算單元的設計
《信息技術與網絡安全》2020年第5期
徐偉民1,黃魯1,蔣明峰2
1.中國科學技術大學 微電子學院,安徽 合肥 230026; 2.中國科學技術大學 信息科學技術學院,安徽 合肥 230026
摘要: 提出一種基于NOR Flash的模擬卷積運算單元,與同類模擬卷積運算單元相比具有高精度、高能耗比、低噪聲的特點。該單元采用存算一體架構,將卷積核的權重參數以閾值電壓的方式存儲在Flash中,輸入圖片經過模擬卷積運算得到輸出圖片。在SMIC 65 nm浮柵工藝下,使用SOBEL邊緣檢測算法評估該單元的性能。仿真結果表明,在3.3 V電源電壓,100 MHz時鐘下,實現一個3×3卷積核的Flash陣列的能耗比達到0.18 TOPS/W,卷積計算結果的峰值信噪比(PSNR)為39.05 dB。
中圖分類號:TN432
文獻標識碼:A
DOI: 10.19358/j.issn.2096-5133.2020.05.013
引用格式:徐偉民,黃魯,蔣明峰.基于NOR Flash的卷積計算單元的設計[J].信息技術與網絡安全,2020,39(5):63-68.
Abstract:
Key words :

深度學習在人臉識別、音頻識別、圖像分類等領域中得到廣泛應用。深度學習網絡具有大量的權重數據和大量的乘累加操作,極大的算力需求和功耗限制使得深度學習應用難以部署在物聯網終端設備。而在深度學習網絡中,卷積計算占用前向計算89%的時間,隨之產生巨大的功耗。所以高速、低功耗的卷積計算單元的設計成為迫切的需求。

主流的馮諾依曼架構中,計算單元和內存單元是兩個完全分離的單元,計算單元根據指令從內存讀取數據,在計算單元完成計算,再存回內存。數據需要在計算單元和存儲單元之間進行頻繁的移動,因此帶來較大的功耗和較低的運算效率。存算一體架構將計算單元與內存單元合二為一,在存儲數據的同時完成運算,從而極大地減少了計算過程中數據存取的時間和功耗。實現存算一體化的介質有相變存儲PCM,靜態隨機存儲SRAM、浮柵器件Flash等。Flash具有工藝成熟、成本低等特點,因此本設計采用Flash作為存算一體的介質。具體做法是將卷積核的權值映射到Flash陣列的閾值電壓,然后Flash陣列進行高速、低功耗的模擬乘累加計算來加速卷積計算過程。

本文的主要內容在于:(1)利用Flash的線型區I/V特性,設計基于NOR Flash的模擬矩陣計算單元;(2)基于模擬矩陣計算單元,設計了基于NOR Flash的模擬卷積計算單元;(3)通過SOBEL邊緣檢測算子評估基于NOR Flash的卷積計算單元的性能。


本文詳細內容請下載http://www.xxav2194.com/resource/share/2000003121


作者信息:

徐偉民1,黃魯1,蔣明峰2(1.中國科學技術大學 微電子學院,安徽 合肥 230026;

2.中國科學技術大學 信息科學技術學院,安徽 合肥 230026)


此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 日本a级视频在线播放| 狠狠色丁香婷婷久久综合蜜芽 | 天天在线综合网| 久久婷婷五月综合成人D啪| 污污小视频在线观看| 四虎成人精品免费影院| 欧美色图在线播放| 大象传媒在线观看| 中文字幕亚洲欧美日韩在线不卡| 朋友的放荡尤物娇妻| 亚洲精品日韩中文字幕久久久| 美女脱得一二净无内裤全身的照片| 国产欧美日韩视频在线观看| 99视频精品全部在线播放| 无码天堂va亚洲va在线va| 亚洲一区二区三区久久久久| 国产精品自在线拍国产手机版 | 国产精品香蕉在线观看| 一级毛片一级毛片一级毛片aaav| 日韩美一区二区| 午夜精品一区二区三区在线观看| 一级毛片成人午夜| 日韩精品亚洲人成在线观看| 亚洲电影免费观看| 精品无码日韩一区二区三区不卡| 国产在线视精品麻豆| 2022国产麻豆剧果冻传媒影视| 好叼操这里只有精品| 久久99精品久久久久久噜噜 | mm131嫩王语纯翘臀| 新婚之夜性史观看| 久久精品无码午夜福利理论片 | 欧美黑人激情性久久| 免费鲁丝片一级在线观看| 色猫咪av在线网址| 国产成人做受免费视频| 曰批全过程免费视频网址| 大香伊人久久精品一区二区| 三年片在线观看免费观看大全中国 | 波多野结衣大战欧美黑人| 北条麻妃jul一773在线看|