《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 其他 > 設(shè)計應(yīng)用 > 基于Transformer和語義增強的人群計數(shù)算法
基于Transformer和語義增強的人群計數(shù)算法
網(wǎng)絡(luò)安全與數(shù)據(jù)治理 2023年第5期
何晴,楊倩倩,彭思凡,殷保群
(中國科學(xué)技術(shù)大學(xué)信息科學(xué)技術(shù)學(xué)院,安徽合肥230027)
摘要: 針對人群圖像中的尺度變化問題,提出了基于Transformer和語義增強的人群計數(shù)算法。為了能有效應(yīng)對尺度變化問題,首先引入Transformer作為主干網(wǎng)對全局上下文進行建模來獲得全局感受野。然后由上至下依次融合主干網(wǎng)相鄰層次的特征圖,在融合過程中強化多個層次特征圖的語義信息。接著對多層次特征圖進行動態(tài)特征選擇,選擇出適合密度圖生成的特征。最后,通過注意力圖來調(diào)整密度圖抵抗背景干擾,以此來生成高質(zhì)量的人群密度估計圖。在ShanghaiTech、UCFQNRF和JHUCROWD++三個數(shù)據(jù)集上進行了大量的實驗來對算法的有效性進行驗證,實驗結(jié)果表明所提算法能有效提高模型的準(zhǔn)確性和魯棒性。
中圖分類號:TP391.1
文獻(xiàn)標(biāo)識碼:A
DOI:10.19358/j.issn.2097-1788.2023.05.009
引用格式:何晴,楊倩倩,彭思凡,等.基于Transformer和語義增強的人群計數(shù)算法[J].網(wǎng)絡(luò)安全與數(shù)據(jù)治理,2023,42(5):50-58.
Transformer and semantic enhancement for crowd counting
He Qing,Yang Qianqian,Peng Sifan,Yin Baoqun
(School of Information Science and Technology, University of Science and Technology of China, Hefei 230027, China)
Abstract: Aiming at the problem of scale variation in crowd images, this paper proposes a crowd counting algorithm based on Transformer and semantic enhancement. Firstly, Transformer is introduced as the backbone of the network. Because it can model the global context and obtain the global receptive field, which can effectively deal with the scale variation. Then, the feature maps of adjacent levels of the backbone network are fused from top to bottom in turn, and the semantic information of multiple levels of feature maps is strengthened in the fusion process. Afterwards the dynamic feature selection of multilevel feature maps is carried out, and the features suitable for density map generation are selected. Finally, the density map is adjusted to resist background interference by attention masks, so as to generate highquality crowd density estimation map. In this paper, a large number of experiments are carried out on ShanghaiTech, UCF_QNRF and JHUCROWD++ datasets to verify the effectiveness of the algorithm. The experimental results show that the proposed algorithm can effectively improve the accuracy and robustness of the model.
Key words : crowd counting; Transformer; semantic enhancement; feature selection

0    引言

人群計數(shù)在視頻監(jiān)控、人群分析和公共安全領(lǐng)域發(fā)揮著重要作用,考慮到大規(guī)模的人群聚集事件的頻繁發(fā)生,對擁擠場景的人群分析十分必要。然而現(xiàn)階段人群計數(shù)的應(yīng)用還受到很大的限制,在諸多限制中,圖像中人頭尺寸不一致的問題尤其受到大多數(shù)研究者的關(guān)注。由于攝像頭高度和角度受到限制,所拍攝的圖像存在透視失真,從而導(dǎo)致了圖像中目標(biāo)尺度差異較大。如圖1所示,離攝像頭遠(yuǎn)處的目標(biāo)尺度較大,近處的目標(biāo)尺度較小。為了解決尺度變化問題,本文提出基于Transformer語義增強的人群計數(shù)算法,利用Transformer獲取全局感受野,由上至下依次融合相鄰層次特征并對語義信息進行增強,動態(tài)選擇適合密度圖生成的特征,從而生成高質(zhì)量的人群密度估圖。



本文詳細(xì)內(nèi)容請下載:http://www.xxav2194.com/resource/share/2000005334




作者信息:

何晴,楊倩倩,彭思凡,殷保群

(中國科學(xué)技術(shù)大學(xué)信息科學(xué)技術(shù)學(xué)院,安徽合肥230027)


微信圖片_20210517164139.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
主站蜘蛛池模板: 99re6在线视频精品免费下载| 国产自国产自愉自愉免费24区| 公交车忘穿内裤被挺进小说白| 五月天丁香久久| 好吊日免费视频| 久久精品国产精品亚洲毛片| 浪荡欲乱之合集| 国产hs免费高清在线观看| **一级一级毛片免费观看| 张瑶赵敏大学丝袜1-10| 久碰人澡人澡人澡人澡91| 潮喷大喷水系列无码久久精品 | 久久夜色精品国产亚洲| 欧美视频网站在线观看| 办公室啪啪激烈高潮动态图| 韩国精品一区二区三区无码视频| 国产精品老女人精品视| xxxxwww日本在线| 无码精品日韩中文字幕| 亚洲bt欧美bt精品| 波多野结衣与上司出差| 动漫精品一区二区三区四区| 韩国三级在线视频| 国产男女爽爽爽爽爽免费视频| aaa特级毛片| 成人免费视频网站www| 久久婷婷五月综合97色| 欧美人与zoxxxx另类| 亚洲综合激情九月婷婷| 精品国产精品国产| 国产专区在线播放| 国产激情视频在线播放| 国产精品蜜芽在线观看| a级毛片免费高清毛片视频| 成人在线免费观看网站| 久久国产加勒比精品无码| 欧洲多毛裸体xxxxx| 亚洲欧洲日产国码在线观看 | 夜夜精品视频一区二区| 中国一级特黄的片子免费 | 尤物视频在线看|