《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計 > 設(shè)計應(yīng)用 > 基于GPU的稀疏深度神經(jīng)網(wǎng)絡(luò)性能優(yōu)化
基于GPU的稀疏深度神經(jīng)網(wǎng)絡(luò)性能優(yōu)化
電子技術(shù)應(yīng)用
石于誠,黃建強,邊浩東,吳利,賈金芳,王曉英
青海大學(xué) 計算機技術(shù)與應(yīng)用系,青海 西寧 810016
摘要: 摘 要:隨著神經(jīng)網(wǎng)絡(luò)層數(shù)不斷加深,稀疏深度神經(jīng)網(wǎng)絡(luò)在計算與存儲空間上更具優(yōu)勢,但稀疏深度神經(jīng)網(wǎng)絡(luò)的性能仍然有待優(yōu)化。為此提出基于GPU的稀疏深度神經(jīng)網(wǎng)絡(luò)性能優(yōu)化方法,對于計算順序進行調(diào)整,增強數(shù)據(jù)重用性,并結(jié)合GPU的獨特結(jié)構(gòu)與CUDA編程方法,通過預(yù)取等方法進一步提升性能?;贕raphChallenge官方提供的數(shù)據(jù)集,相較于cuSPARSE相關(guān)庫函數(shù),最高獲得了2.5倍的性能加速。
中文引用格式: 石于誠,黃建強,邊浩東,等. 基于GPU的稀疏深度神經(jīng)網(wǎng)絡(luò)性能優(yōu)化[J]. 電子技術(shù)應(yīng)用,2023,49(12):14-19.
英文引用格式: Shi Yucheng,Huang Jianqiang,Bian Haodong,et al. Performance optimization of sparse deep neural network based on GPU[J]. Application of Electronic Technique,2023,49(12):14-19.
Performance optimization of sparse deep neural network based on GPU
Shi Yucheng,Huang Jianqiang,Bian Haodong,Wu Li,Jia Jinfang,Wang Xiaoying
Department of Computer Technology and Application,Qinghai University,Xining 810016,China
Abstract: With the deepening of neural network layers, the sparse deep neural network has more advantages in computing and storage space, but the performance of the sparse deep neural network still needs to be optimized. Therefore, a performance optimization method based on GPU sparse deep neural network is proposed, which adjusts the order of computation, enhances the reusability of data, and combines the unique structure of GPU with CUDA programming method, performance is further improved by prefetching and other methods. According to GraphChallenge's official data set, it achieved up to 2.5 times the performance acceleration compared to the related cuSPARSE library functions.
Key words : deep neural network;sparsification;heterogeneous platform;sparse matrix-matrix multiplication

0 引言

隨著神經(jīng)網(wǎng)絡(luò)原理性研究的不斷深入以及算力逐步增強,越來越多的深度神經(jīng)網(wǎng)絡(luò)涌現(xiàn)。例如在自然語言處理[1]領(lǐng)域,谷歌提出Transformer[2]模型,其本身對于梯度消失這一難題的解決以及可以進行并行訓(xùn)練等一系列的優(yōu)勢,使得大模型愈發(fā)火熱,ChatGPT[3]也是在此基礎(chǔ)上訓(xùn)練得到的。但規(guī)模龐大的深度神經(jīng)網(wǎng)絡(luò)對于模型應(yīng)用的時效性提出了更大的挑戰(zhàn),由于“存儲墻”[4]和“功耗墻”[5]的存在,稀疏深度神經(jīng)網(wǎng)絡(luò)[6-7]進入研究視野,GPU設(shè)備和稀疏深度神經(jīng)網(wǎng)絡(luò)的結(jié)合使得訓(xùn)練速度再邁上一個嶄新的臺階。



本文詳細(xì)內(nèi)容請下載:http://www.xxav2194.com/resource/share/2000005799


作者信息

石于誠,黃建強,邊浩東,吳利,賈金芳,王曉英

(青海大學(xué) 計算機技術(shù)與應(yīng)用系,青海 西寧 810016)



weidian.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
主站蜘蛛池模板: 在线播放黄色片| 亚洲综合激情视频| 国产成人亚洲精品无码av大片| 国内精品卡1卡2卡区别| 国产精品揄拍一区二区久久| 在线观看a网站| 国产精品va一区二区三区| 国产精品第8页| 国产精品视频免费播放| 国产热の有码热の无码视频| 国产精品内射久久久久欢欢| 国模吧2021新入口| 国产成社区在线视频观看| 国产真实伦在线观看| 国产免费AV片无码永久免费| 国产在线步兵一区二区三区| 国产成a人亚洲精v品无码| 国产成人久久精品二区三区| 国产v片成人影院在线观看| 四虎影院的网址| 啊轻点灬大ji巴太粗太长了免费 | 久久中文字幕无码专区| a级片免费网站| 国产90后美女露脸在线观看| 黑人巨大精品播放| 香港三级欧美国产精品| 韩国大尺度床戏未删减版在线播放 | 爱情鸟第一论坛com高清免费| 激情伊人五月天久久综合 | 韩国无遮挡羞羞漫画| 狠狠97人人婷婷五月| 日韩欧美综合视频| 女人18特级一级毛片免费视频| 巨粗挺进女县长| 夜色邦合成福利网站| 国产肉体xxxx裸体137大胆| 国产一区二区三区在线观看免费| 亚洲欧美自拍一区| 亚洲国产成人精品无码一区二区 | 无码人妻精品一区二| 国产精品99久久久久久www|