《電子技術應用》
您所在的位置:首頁 > 其他 > 設計應用 > 基于分解策略的多標簽在線特征選擇算法
基于分解策略的多標簽在線特征選擇算法
網絡安全與數據治理 4期
張永偉1,2,朱 祁1,2,吳永城1,2
(1.南瑞集團(國網電力科學研究院)有限公司,江蘇 南京210003; 2.南京南瑞智慧交通科技有限公司,江蘇 南京210032)
摘要: 在線學習方法是用于大規模數據集的、高效且可擴展的機器學習算法。然而,在對多標簽數據集進行特征選擇時,傳統的在線多標簽學習方法需要訪問數據集的所有特征,當數據集具有較高維度時,這種在線學習方式并不能適用于實際情景。針對多標簽數據集的特征選擇,在現有研究的基礎上,使用二類分解策略,提出基于分解策略的多標簽在線特征選擇算法。該算法利用稀疏正則化和截取方法進行在線特征選擇,降低計算復雜度。實驗表明,算法的特征選擇性能優于其他多標簽在線特征選擇算法。
中圖分類號: TP305;TP181
文獻標識碼: A
DOI: 10.19358/j.issn.2097-1788.2022.04.010
引用格式: 張永偉,朱祁,吳永城. 基于分解策略的多標簽在線特征選擇算法[J].網絡安全與數據治理,2022,41(4):65-71,77.
Online multi-label feature selection algorithm based on binary relevance strategy
Zhang Yongwei1,2,Zhu Qi1,2,Wu Yongcheng1,2
(1.NARI Group Corporation(State Grid Electric Power Research Institute),Nanjing 210003,China; 2.Nanjing NARI Intelligent Transport Technology Co.,Ltd.,Nanjing 210032,China)
Abstract: Online learning method is an efficient and extensible machine learning algorithm for large-scale applications. However, when selecting features for multi-label datasets, the traditional online multi-label learning algorithms need to access all the features of the dataset. When the dataset has a higher dimension, this online learning method cannot be applied to the actual situation. Based on the existing research, a multi-label online feature selection algorithm based on decomposition strategy is proposed by using binary relevance strategy. This algorithm uses sparse regularization and interception methods for online feature selection to reduce computational complexity. The experimental results show that the feature selection performance of the algorithm is better than that of other multi-label online feature selection algorithms.
Key words : feature selection;online learning;multi-label classification;binary relevance strategy

0 引言

近年來,隨著多標簽分類問題的深入研究,出現了大量的多標簽分類算法。目前,在多標簽分類中,存在四種主要的處理策略:數據分解法、算法擴展法、混合法和集成法。特征選擇是多標簽分類問題中的一個重要課題,并且已經進行了廣泛研究。對于分類,特征選擇的目標是通過相關特征的一個子集來構建有效的預測模型,通過消除不相關和冗余特征,可以減輕維度災難的影響,提高泛化性能,加快學習過程,提高模型預測的性能。特征選擇已在許多領域得到應用,特別是在涉及高維數據的問題中。

雖然已經進行了廣泛研究,但大多數現有的特征選擇研究都局限于批量學習,假定特征選擇任務是以離線/批量學習的方式進行的,而且訓練實例的特征是先驗的。這樣的假設并不總是適用于訓練樣本以順序方式到達的實際應用。與批量學習方式相比,在線學習方式則采用增量的方式處理數據集,相對而言,計算代價要小于批量學習算法。在現有的多標簽在線分類算法中計算數據的全部特征信息是需要代價的。尤其是存在高維數據和數據冗余時,傳統的多標簽在線分類算法,需大量計算且分類性能較差。本文利用在線學習的優勢,研究了多標簽在線特征選擇問題,旨在通過有效地探索在線學習方法來解決多標簽特征選擇問題。具體而言,多標簽在線特征選擇的目標是研究在線分類器,其僅涉及用于分類的少量和固定數量的特征。當處理高維度的連續訓練數據時,如在線垃圾郵件分類任務(其中傳統的批量特征選擇方法不能直接應用),在線特征選擇尤為重要和必要。




本文詳細內容請下載:http://www.xxav2194.com/resource/share/2000004992





作者信息:

張永偉1,2,朱  祁1,2,吳永城1,2

(1.南瑞集團(國網電力科學研究院)有限公司,江蘇 南京210003;

2.南京南瑞智慧交通科技有限公司,江蘇 南京210032)


微信圖片_20210517164139.jpg

此內容為AET網站原創,未經授權禁止轉載。
主站蜘蛛池模板: 一区二区在线播放视频| 亚洲一卡2卡4卡5卡6卡在线99| 青青青青青草原| 在线观看成人网站| 久久久久人妻一区精品性色av| 欧美日韩一级二级三级| 兽皇videos极品另类| 高岭家の二轮花未增删| 国产精品美女免费视频观看| 一本大道AV伊人久久综合| 日本边吃奶边摸边做在线视频| 亚洲白嫩在线观看| 美女扒开胸罩露出奶了无遮挡免费| 国产男女无遮挡猛进猛出| 99色视频在线观看| 成年美女黄网站色大片免费看| 亚洲中文字幕久久精品无码喷水 | 国产综合色在线视频| 中国人免费观看高清在线观看二区| 日韩精品在线视频观看| 亚洲日韩aⅴ在线视频| 男人边吃奶边做弄进去免费视频 | 国产另类的人妖ts视频| 91理论片午午伦夜理片久久| 小明天天看成人免费看| 久久99国产精品成人欧美| 最近更新中文字幕影视| 亚洲第一成年网站大全亚洲| 精品大臿蕉视频在线观看| 国产乱码一区二区三区爽爽爽| 欧洲97色综合成人网| 国产精品香蕉在线| a级黄色毛片视频| 性欧美vr高清极品| 久久久精品午夜免费不卡| 极品丰满美女国模冰莲大尺度| 亚洲欧美不卡视频在线播放| 男人女人真曰批视频大全免费观看| 四虎免费在线观看| 被三个男人绑着躁我好爽视频| 国产无遮挡又黄又爽在线视频|