《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于模板匹配OCR的報告自動歸檔系統研究
基于模板匹配OCR的報告自動歸檔系統研究
信息技術與網絡安全
張 辰1,陳 陽2
(1.廣東省建設工程質量安全檢測總站有限公司,廣東 廣州510500; 2.廣東省建筑科學研究院集團股份有限公司,廣東 廣州510500)
摘要: 針對建筑檢測行業中檢測報告多、人工歸檔效率低下的問題,利用模板匹配算法與LeNet框架建立了一套強魯棒性用于報告文件數字符號的OCR識別系統。針對報告中感興趣區域(ROI)位置和大小不固定的問題,采用了機器視覺領域中的模板匹配定位算法來定位報告文件的ROI區域。結合LeNet網絡與模板匹配定位算法,實現了傳統機器視覺方法與人工智能方法的結合,構建了一套檢測報告自動歸檔系統。所構建的自動歸檔系統的正確歸檔率達到了95.8%,有效節約了人工成本與時間成本。
中圖分類號: TP274
文獻標識碼: A
DOI: 10.19358/j.issn.2096-5133.2021.08.014
引用格式: 張辰,陳陽. 基于模板匹配OCR的報告自動歸檔系統研究[J].信息技術與網絡安全,2021,40(8):84-89.
Research on automatic filing system of detection report based on template matching and OCR recognition
Zhang Chen1,Chen Yang2
(1.Guangdong Construction Engineering Quality and Safety Inspection Station Co.,Ltd.,Guangzhou 510500,China; 2.Guangdong Building Research Institute Group Co.,Ltd.,Guangzhou 510500,China)
Abstract: In view of the problems of many detection reports and low efficiency of manual filing in the construction inspection industry, a strong robust OCR identification system for digital symbols of report files is established by using template matching algorithm and LeNet framework. Aiming at the problem that the location and size of ROI in the report are not fixed, a template matching location algorithm in the field of machine vision is used to locate the ROI region of the report file. Combined with the matching and positioning algorithm of LeNet network and template, the combination of traditional machine vision method and artificial intelligence method is realized, and a set of automatic filing system of detection report is constructed. The correct filing rate of the automatic archive system is 95.8%, which effectively saves labor cost and time cost.
Key words : template matching;OCR identification;automatic filing

0 引言

光學字符識別(Optical Character Recognition,OCR)是指對文本資料的圖像文件進行分析識別處理,獲取文字及版面信息的過程。亦即將圖像中的文字進行識別,并以文本的形式返回。其在文檔歸檔應用背景下具有廣闊的市場前景。OCR字符識別技術經過多年發展,已有LeNet[1]、RRPN[2]、DMPNet[3]、CTPN[4]等OCR網絡結構被提出。其中,CTPN是目前應用最廣的文本檢測模型之一。其基本假設是單個字符相較于異質化程度更高的文本行更容易被檢測,因此先對單個字符進行類似R-CNN的檢測,并在檢測網絡中加入雙向LSTM[5],使檢測結果形成序列提供了文本的上下文特征,便可以將多個字符進行合并得到文本行。LeNet網絡提出時間較早,在銀行票據手寫體字符識別方面有著長期的應用。上述網絡結構可以在通用背景下有效識別場景中的字符,對于非垂直文本也能進行檢測。對于大多數OCR的應用場景,并不需要對圖片中的所有字符進行識別,往往只需要對部分ROI區域的字符進行檢測,但OCR技術對ROI區域的位移與旋轉適應性較差,需要訓練單獨的網絡來對ROI區域進行定位。機器視覺技術在制造業領域有著廣泛的應用,特別是在工件定位、視覺測量等方面有大量成熟的算法,其中,模板匹配算法則針對工業定位[6-7]的應用背景,提出了基于灰度[8]、邊緣[9]、變換域[10]的模板匹配算法,能適應各種工業定位需求[11-15]。



本文詳細內容請下載:http://www.xxav2194.com/resource/share/2000003731



作者信息:

張  辰1,陳  陽2

(1.廣東省建設工程質量安全檢測總站有限公司,廣東 廣州510500;

2.廣東省建筑科學研究院集團股份有限公司,廣東 廣州510500)


此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 毛片a级毛片免费播放100| 久久综合狠狠综合久久综合88| 麻绳紧缚奴隷女囚| 天堂资源在线中文| 久久精品国产99精品国产2021| 激情无码人妻又粗又大| 国产亚洲情侣久久精品| 91精品国产综合久久青草| 无人高清视频免费观看在线动漫| 国产ts人妖另类专区| 3d姐弟关系风车动漫(p)_在线观看 | 精品国产无限资源免费观看| 好男人社区www在线观看高清| 久久精品人人槡人妻人人玩 | 波多野结衣种子网盘| 国产**毛片一级视频| 久草视频在线免费| 成人免费黄网站| 久久精品国产亚洲精品2020| 欧美激情一区二区三区在线| 八区精品色欲人妻综合网| 要灬要灬再深点受不了好舒服| 国产精品天天干| bbw在线观看| 未发育孩交videossex| 亚洲色偷偷色噜噜狠狠99网| 肉伦迎合下种怀孕| 在线a免费观看| 两个人一上一下剧烈运动| 日韩欧美第一页| 亚洲成人福利在线| 男人添女人下部高潮全视频| 国产a级特黄的片子视频| 国产私拍福利精品视频网站| 成人五级毛片免费播放| 久久精品国产99国产精品亚洲| 欧美最猛性xxxxx免费| 你是我的女人中文字幕高清| 国产鲁鲁视频在线播放| 国产香蕉在线精彩视频| xxxx性bbbb欧美野外|