《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于K-Means算法的SSD-Mobilenet模型優化研究
基于K-Means算法的SSD-Mobilenet模型優化研究
信息技術與網絡安全
劉津龍,賈郭軍
(山西師范大學 數學與計算機科學學院, 山西 臨汾041000)
摘要: SSD-Mobilenet目標檢測模型是將SSD和Mobilenet進行結合衍生出的一種輕量化模型,同時具備了兩模型各自的優勢,即多尺度檢測和模型輕量化。在原模型中特征提取層使用了人為設置的先驗框,這樣的設置存在一定的主觀性,并不適用于對特定場景下單一類別目標的識別與定位。為解決這一問題,本文提出了使用K-Means算法對目標真實框的寬高比進行聚類分析,提升模型在特定場景下對單一類別目標的檢測能力,規避了人為設置的主觀先驗性。使用Pascal VOC 2007數據集對該模型進行訓練和評估,實驗結果顯示,模型的mAP值比Fast RCNN提高了4.5%,比Faster RCNN提高了1.5%,比SSD-300提高了3.4%,比YOLOv2提高了2.4%。
中圖分類號: TP391
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.01.007
引用格式: 劉津龍,賈郭軍。 基于K-Means算法的SSD-Mobilenet模型優化研究[J].信息技術與網絡安全,2021,40(1):37-44.
Research on SSD-Mobilenet model optimization based on K-Means algorithm
Liu Jinlong,Jia Guojun
(School of Mathematics and Computer Science,Shanxi Normal University,Linfen 041000,China)
Abstract: The SSD-Mobilenet target detection model is a lightweight model derived from the combination of SSD and Mobilenet. It also has the advantages of the two models, namely multi-scale detection and lightweight model. In the original model, the feature extraction layer uses artificially set a priori boxes. Such settings are subjective and unsuitable for the recognition and positioning of single-category targets in specific scenarios. In order to solve this problem, this paper proposes to use the K-Means algorithm to perform cluster analysis on the aspect ratio of the real frame of the target, which improves the model′s ability to detect a single category of targets in a specific scenario, and avoids the subjective apriority of artificial settings. This paper uses the Pascal VOC 2007 data set to train and evaluate the model. The experimental results show that the mAP value of the model is 4.5% higher than Fast-RCNN, 1.5% higher than Faster-RCNN, 3.4% higher than SSD-300, YOLOv2 increased by 2.4%.
Key words : object detection;K-Means;SSD-Mobilenet;anchor box;cluster

0    引言

  目標檢測是將目標從圖像中提取出來的計算機視覺技術,是計算機視覺領域的重要組成部分,是一切計算機視覺任務的基礎,具有較高的研究價值。運動目標檢測是從不斷變化的序列圖像中進行目標的識別和定位,分為靜態背景下的目標檢測和動態背景下的目標檢測。目前,解決目標檢測問題的思路主要有如下兩種:一是依賴于目標的先驗知識,提前為運動目標建模,然后在圖像序列中實時找到匹配的目標;二是不依賴于先驗知識,直接從圖像序列中檢測到運動目標,并進行類別判定。

  傳統的目標檢測一般使用滑動窗口的檢測機制,主要包括以下三個步驟:第一步利用不同尺寸的滑動窗口[1]在滑動途中覆蓋的某一部分作為候選區域;第二步提取候選區域相關的視覺特征形成特征向量,例如人臉檢測常用的Harr特征[2],行人檢測和普通目標檢測常用HOG特征[3];第三步利用提取到的特征對目標進行識別和定位。該類目標檢測算法的窗口區域選擇策略沒有針對性,時間復雜度高,窗口冗余相對較多。手工設計的特征對目標可能出現的多樣性變化沒有較強的魯棒性,比如形態變化和光照影響等。

 



本文詳細內容請下載:http://www.xxav2194.com/resource/share/2000003315




作者信息:

劉津龍,賈郭軍

(山西師范大學 數學與計算機科學學院, 山西 臨汾041000)    


此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 国产超薄肉色丝袜的免费网站| 最新国产精品拍自在线播放| 国产一级做美女做受视频| 51妺嘿嘿午夜福利| 成年午夜视频免费观看视频 | 人妻少妇精品久久久久久| 野花社区视频在线观看| 国产精品白丝AV网站| www.夜夜操.com| 日本人与物videos另类| 亚洲国产成人久久综合一区| 男女一边摸一边做爽的免费视频| 国产一区二三区| 国色天香网在线| 国产裸拍裸体视频在线观看| 一区二区三区波多野结衣| 日本xxx在线播放| 九九免费久久这里有精品23| 欧美精品第1页在线播放| 免费播放美女一级毛片| 色婷婷.com| 国产妇女馒头高清泬20p多| 33333在线亚洲| 大陆少妇xxxx做受| 下面一进一出好爽视频| 日本肉体裸交xxxxbbbb| 亚洲人成黄网在线观看| 波多野结衣一区二区免费视频| 农村胖肥熟口味重| 能在线观看的一区二区三区| 国产婷婷一区二区三区| 婷婷丁香六月天| 国产肝交视频在线观看| chinesefree国语对白| 成人国产精品一级毛片视频| 久久亚洲精品视频| 最近高清中文在线国语字幕| 亚洲日韩欧美一区二区三区在线 | 国产私拍福利精品视频推出| 99久久精品午夜一区二区| 尤物在线观看精品国产福利片|