《電子技術(shù)應(yīng)用》
您所在的位置:首頁 > 模擬設(shè)計(jì) > 設(shè)計(jì)應(yīng)用 > 基于深度學(xué)習(xí)的可視化圖表分類方法研究
基于深度學(xué)習(xí)的可視化圖表分類方法研究
電子技術(shù)應(yīng)用
張明凱1,胡軍國1,劉江南2,鄧飛1,尹文杰1
1.浙江農(nóng)林大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院;2.浙江農(nóng)林大學(xué) 化學(xué)與材料工程學(xué)院
摘要: 可視化圖表的分類研究對于圖表理解和文檔解析具有很大的意義。分別通過爬蟲和軟件生成的方式,構(gòu)建了兩個(gè)包含16類常見圖表的數(shù)據(jù)集,該數(shù)據(jù)集在數(shù)量、類型和樣式豐富性上具有一定的優(yōu)勢。在3個(gè)數(shù)據(jù)集上實(shí)驗(yàn)對比了Transformer架構(gòu)和卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)的模型,結(jié)果表明Transformer架構(gòu)在圖表分類任務(wù)上具有一定優(yōu)勢。基于Swin Transformer模型,設(shè)計(jì)了多種數(shù)據(jù)增強(qiáng)策略,在增加模型泛化性的同時(shí)也引入了分布差異;通過對不同策略訓(xùn)練出的模型預(yù)測進(jìn)行均值融合,同單模型相比分類性能有較大提升。在6個(gè)測試集上對集成模型進(jìn)行了測試,分類準(zhǔn)確率均大于0.9;對于圖像質(zhì)量高、視覺形式簡單的生成圖表,模型分類準(zhǔn)確率接近1。
中圖分類號:TP391 文獻(xiàn)標(biāo)志碼:A DOI: 10.16157/j.issn.0258-7998.244851
中文引用格式: 張明凱,胡軍國,劉江南,等. 基于深度學(xué)習(xí)的可視化圖表分類方法研究[J]. 電子技術(shù)應(yīng)用,2024,50(5):58-65.
英文引用格式: Zhang Mingkai,Hu Junguo,Liu Jiangnan,et al. Research on visualization chart classification method based on deep learning[J]. Application of Electronic Technique,2024,50(5):58-65.
Research on visualization chart classification method based on deep learning
Zhang Mingkai1,Hu Junguo1,Liu Jiangnan2,Deng Fei1,Yin Wenjie1
1.College of Mathematics and Computer Science, Zhejiang A & F University; 2.College of Chemistry and Materials Engineering, Zhejiang A & F University
Abstract: The classification research of visual charts holds significant implications for chart comprehension and document parsing. This paper has constructed two datasets, each containing 16 common chart types, using web scraping and software generation. These datasets exhibit certain advantages in terms of quantity, type, and stylistic diversity. This paper has also conducted experiments comparing Transformer and Convolutional Neural Network (CNN) architectures on three datasets, and the results indicates that the Transformer architecture has certain advantages in the task of chart classification. Utilizing the Swin Transformer model, this paper designs various data augmentation strategies, not only increasing the generalization of the model, but also introducing the distribution difference. By averaging predictions from models trained with different strategies, there is a significant improvement in classification performance compared to individual models. The ensemble model was tested on 6 test sets, with classification accuracy exceeding 0.9 in all cases. For generated charts with high image quality and simple visual forms, the model's classification accuracy approached 1.
Key words : chart classification;chart comprehension;convolutional neural network;Swin Transformer;model ensemble

引言

可視化圖表作為一種直觀的信息表現(xiàn)形式,往往被用于文獻(xiàn)或報(bào)告中展示關(guān)鍵的數(shù)據(jù),在現(xiàn)代媒介中使用十分廣泛。但受限于當(dāng)下的技術(shù)水平,這些圖表信息很難被計(jì)算機(jī)檢索,大量的數(shù)據(jù)埋沒在浩如煙海的網(wǎng)絡(luò)中。隨著相關(guān)數(shù)據(jù)的增加,圖表的自動化解析逐漸被重視起來。圖表通過簡單的圖形幫助人類理解數(shù)據(jù)背后隱含的差異或趨勢等信息,但對于計(jì)算機(jī)來講,讀取這些圖形所代表的含義卻十分困難。不同類型的圖表具有不同的視覺形式,很難用一套固定的模式或方法解析出來,目前較為有效的方法是根據(jù)圖表類型使用特定的數(shù)據(jù)解析方案[1]。因此,理解圖表的首要工作是圖表類型識別,可視化圖表的分類研究對于圖表理解和文檔解析具有很大的意義。

圖表分類技術(shù)作為圖像分類技術(shù)的子分支,與計(jì)算機(jī)視覺技術(shù)的發(fā)展聯(lián)系十分密切。表1對相關(guān)研究進(jìn)行了總結(jié)。早期研究[2-5]多使用一些手工設(shè)計(jì)的過濾器來提取圖表圖像的特征,先將提取到的特征降維,再通過一些機(jī)器學(xué)習(xí)方法實(shí)現(xiàn)分類。這些研究大都需要手工構(gòu)建特征,數(shù)據(jù)集也相對較小,模型的泛化性不高。隨著計(jì)算機(jī)視覺領(lǐng)域深度學(xué)習(xí)模型的發(fā)展,基于卷積神經(jīng)網(wǎng)絡(luò)的分類模型被用在圖表分類任務(wù)中,這些研究[6-14]的分類效果有了很大提升,數(shù)據(jù)集也得到很大程度上的擴(kuò)充。


本文詳細(xì)內(nèi)容請下載:

http://www.xxav2194.com/resource/share/2000005988


作者信息:

張明凱1,胡軍國1,劉江南2,鄧飛1,尹文杰1

(1.浙江農(nóng)林大學(xué) 數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,浙江 杭州 311300;2.浙江農(nóng)林大學(xué) 化學(xué)與材料工程學(xué)院,浙江 杭州 311300)


Magazine.Subscription.jpg

此內(nèi)容為AET網(wǎng)站原創(chuàng),未經(jīng)授權(quán)禁止轉(zhuǎn)載。
主站蜘蛛池模板: 成人免费大片免费观看网站| 两性午夜又粗又大又爽视频| 特级毛片s级全部免费| 国产性生交xxxxx免费| av片在线观看| 无码任你躁久久久久久| 亚洲日产2021三区| 第一福利官方导航大全| 国产内射999视频一区| 2021天天干| 天天插在线视频| 中文字幕日韩高清版毛片| 最近中文字幕完整版免费| 亚洲综合色7777情网站777| 老师我好爽再深一点的视频| 国产成人综合亚洲一区| 91成人在线播放| 好男人影视社区www在线观看| 久久久久久久人妻无码中文字幕爆| 欧美亚洲国产日韩综合在线播放| 亚洲色大成网站www永久| 精品无码成人片一区二区98| 国产免费观看青青草原网站| 波多野结衣33| 国产麻豆剧果冻传媒一区| xxxxx日韩| 成人爽a毛片在线视频| 久久国产免费一区| 极品尤物一区二区三区| 亚洲欧美国产一区二区三区| 男女做性无遮挡免费视频| 同学浓精灌麻麻| 被女同桌调教成鞋袜奴脚奴| 国产无遮挡AAA片爽爽| 2022国产在线视频| 在线小视频国产| らだ天堂√在线中文www| 成品煮伊在2021一二三久| 久久久伊人影院| 日韩在线一区高清在线| 亚洲av无码日韩av无码网站冲 |