基于梯度優(yōu)化的大語言模型后門識別探究
所屬分類:技術論文
上傳者:wwei
文檔大小:1222 K
標簽: 大語言模型 后門攻擊 基于梯度的后門識別
所需積分:0分積分不夠怎么辦?
文檔介紹:隨著大語言模型的流行并且應用在越來越多的領域,大語言模型的安全問題也隨之而來。 通常訓練大語言模型對數(shù)據(jù)集以及計算資源有著極為苛刻的要求,所以有使用需求的用戶大部分都直接利用網(wǎng)絡上開源的數(shù)據(jù)集以及模型,這給后門攻擊提供了絕佳的溫室。后門攻擊是指用戶在模型中輸入正常數(shù)據(jù)時模型表現(xiàn)像沒有注入后門時一樣正常,但當輸入帶有后門觸發(fā)器的數(shù)據(jù)時模型輸出異常。防止后門攻擊的有效方法就是進行后門識別。目前基于梯度的優(yōu)化方法是比較常用的,但使用這些方法時內(nèi)部影響因子的設定對識別效果具有一定影響。文章就詞令牌數(shù)量、最鄰近數(shù)量、噪聲大小進行了實驗測量和作用機制的分析,以便為后續(xù)使用這些方法的研究者提供參考。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 精品福利视频一区二区三区| 中文字幕在线一区| 色综合久久久久久久久五月 | 欧美性猛交xxx猛交| 国产啪精品视频网站丝袜| 一区二区三区福利| 欧美性猛交xxxx| 国产一级做a爰片久久毛片99 | 91亚洲va在线天线va天堂va国产| 日韩在线看片免费人成视频播放| 啊用力嗯快国产在线观看| a4yy私人影院| 欧洲一卡2卡3卡4卡免费观看| 啊轻点灬大ji巴太粗太男| 69国产成人精品午夜福中文| 欧美精品在线观看| 国产成人a人亚洲精品无码| 一级毛片免费观看不卡视频| 欧美性猛交xxxx乱大交丰满| 国产一区二区三区免费在线视频 | 刘敏涛三级无删减版在线观看| 3atv国产精品视频| 欧美另类videovideosex| 国产三级一区二区三区| 99热在线观看免费| 日韩欧美一及在线播放| 免费福利在线视频| 欧美另类黑人巨大videos| 性欧美视频在线观看| 亚洲偷偷自拍高清| 给我看播放片免费高清| 国产精品久久久精品三级| 中文字幕在线观看第一页| 爱爱视频天天干| 国产免费拔擦拔擦8x高清在线人| a一级爱做片免费| 日韩a一级欧美一级在线播放| 交换交换乱杂烩系列yy| 黑人边吃奶边扎下面激情视频| 女让张开腿让男人桶视频| 久久精品国产亚洲AV天海翼|