可解釋的深度網絡抗噪音干擾性逐層評估方法
網絡安全與數據治理
周瑞豐1,欒瑞鵬2,張超1
1.大連理工大學數學科學學院; 2. 91550部隊
摘要: 在復雜應用場景中,深度神經網絡易受噪音數據干擾,如何客觀、有效、可靠地評估深度網絡的抗噪音干擾性已成為智能化技術開發的關鍵問題之一。然而,現有的評估方法只能對網絡抗噪音干擾性進行整體評估,且不具備可解釋的理論依據。為了解決上述問題,基于閔可夫斯基差線性可分性度量,提出一種深度神經網絡逐層抗噪音干擾性評估方法,實現了神經網絡抗噪音干擾性的可解釋性評估。該方法可以對深度網絡各隱層數據映射行為進行定量分析,解析噪音干擾對網絡各隱層的影響機理,進而建立面向網絡隱層的可解釋抗噪音干擾性評估方法。
中圖分類號:TP181文獻標識碼:ADOI:10.19358/j.issn.2097-1788.2025.09.007
引用格式:周瑞豐,欒瑞鵬,張超. 可解釋的深度網絡抗噪音干擾性逐層評估方法[J].網絡安全與數據治理,2025,44(9):46-50.
引用格式:周瑞豐,欒瑞鵬,張超. 可解釋的深度網絡抗噪音干擾性逐層評估方法[J].網絡安全與數據治理,2025,44(9):46-50.
Explainable methods for layer-wise evaluating noise resistance of deep networks
Zhou Ruifeng1,Luan Ruipeng 2,Zhang Chao1
1. School of Mathematical Science, Dalian University of Technology; 2. Unit 91550
Abstract: In complex application scenarios, deep neural networks are susceptible to noise data interference. How to objectively, effectively, and reliably evaluate the noise resistance of deep networks has become one of the key issues in the development of intelligent technology. However, the existing evaluation methods can only evaluate the noise resistance of the whole network, and have no explainable theoretical basis. To address the above problems, based on Minkowski difference based linear separability measure, a layer-wise noise resistance evaluation method for deep neural networks is proposed, achieving an explainable evaluation of the network′s noise resistance performance. This method can quantitatively analyze the data mapping behavior of each hidden layer of the deep network, explain the influence mechanism of noise interference on each hidden layer of the network, and then establish an explainable noise resistance evaluation method for the network′s hidden layers.
Key words : noise resistance evaluation; explainability; neural network
引言
隨著神經網絡在圖像分類[1]、語義分割[2]等領域的長足發展,其被廣泛地應用于工業生產[3]、自動駕駛[4]、醫學[5]等新的任務場景中。然而,這些新的任務場景往往更加復雜,其中包含著干擾輸入數據的多種噪音,會顯著影響網絡的性能。同時,在這些任務場景中,網絡判斷出錯所造成的后果往往要更加嚴重。因此,如何評估網絡對任務場景中噪音的抗干擾性,從而判斷網絡在該任務場景中的適用性,成為了一個需要解決的問題。
目前,通過生成讓網絡判斷出錯的最小擾動的對抗樣本[6-8]或者生成任務場景[9-10]中常見的模擬噪音都可以作為生成噪音的方法,并進一步得到網絡在面對噪音下的數值化抗干擾性指標。但是,現有的網絡評估方法大多對網絡整體進行評估,無法分析噪音對網絡輸出的影響機理,缺乏可解釋性,并且評估結果也無法對網絡改進起到積極的指導作用。
為了解決上述問題,本文引入基于閔可夫斯基差的線性可分性度量(Minkowski Difference based Linear Separability Measure, MDLSM)作為分類神經網絡的隱層分析工具,借助MDLSM對網絡隱層的數據映射行為進行分析,得到噪音對網絡各個隱層的擾動,確定噪音對網絡的影響機理,從而實現網絡的可解釋性抗干擾性逐層評估。
本文詳細內容請下載:
http://www.xxav2194.com/resource/share/2000006706
作者信息:
周瑞豐1,欒瑞鵬2,張超1
(1.大連理工大學數學科學學院,遼寧大連116024;
2. 91550部隊,遼寧大連116023)
此內容為AET網站原創,未經授權禁止轉載。