基于梯度優(yōu)化的大語言模型后門識(shí)別探究
所屬分類:技術(shù)論文
上傳者:wwei
文檔大小:1222 K
標(biāo)簽: 大語言模型 后門攻擊 基于梯度的后門識(shí)別
所需積分:0分積分不夠怎么辦?
文檔介紹:隨著大語言模型的流行并且應(yīng)用在越來越多的領(lǐng)域,大語言模型的安全問題也隨之而來。 通常訓(xùn)練大語言模型對(duì)數(shù)據(jù)集以及計(jì)算資源有著極為苛刻的要求,所以有使用需求的用戶大部分都直接利用網(wǎng)絡(luò)上開源的數(shù)據(jù)集以及模型,這給后門攻擊提供了絕佳的溫室。后門攻擊是指用戶在模型中輸入正常數(shù)據(jù)時(shí)模型表現(xiàn)像沒有注入后門時(shí)一樣正常,但當(dāng)輸入帶有后門觸發(fā)器的數(shù)據(jù)時(shí)模型輸出異常。防止后門攻擊的有效方法就是進(jìn)行后門識(shí)別。目前基于梯度的優(yōu)化方法是比較常用的,但使用這些方法時(shí)內(nèi)部影響因子的設(shè)定對(duì)識(shí)別效果具有一定影響。文章就詞令牌數(shù)量、最鄰近數(shù)量、噪聲大小進(jìn)行了實(shí)驗(yàn)測(cè)量和作用機(jī)制的分析,以便為后續(xù)使用這些方法的研究者提供參考。
現(xiàn)在下載
VIP會(huì)員,AET專家下載不扣分;重復(fù)下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 理论片中文字幕在线观看| 香蕉视频在线网址| 日本红怡院在线| 亚洲欧美日韩综合久久久久| 翁与小莹浴室欢爱51章| 国产精品亚洲欧美一级久久精品| 中文字幕亚洲精品无码| 机机对机机的30分钟免费软件| 人妻在线无码一区二区三区| 中文字幕AV一区中文字幕天堂| 中文字幕热久久久久久久| a毛看片免费观看视频| 欧美在线第一二三四区| 免费福利在线观看| 青草视频免费看| 国产精品亚洲五月天高清| heisiav1| 成人污视频网站| 久久综合狠狠色综合伊人| 欧美精品亚洲精品日韩专区 | 久久国产精品系列| 欧美日韩一区二区成人午夜电影| 免费看美女扒开腿让男人桶| 色综合色综合久久综合频道 | 久久久婷婷五月亚洲97号色| 欧美在线小视频| 亚洲美女中文字幕| 精品午夜一区二区三区在线观看| 国产乱妇无码大黄aa片| 国产自产21区| 国产精品扒开做爽爽爽的视频 | 久久亚洲国产成人精品性色| 欧美午夜伦理片| 亚洲第一极品精品无码久久| 男女爽爽无遮挡午夜视频在线观看| 四虎影视在线影院在线观看| 高清欧美性猛交xxxx黑人猛交| 国产精品va在线观看无| 91九色视频无限观看免费| 天堂网在线观看在线观看精品| 一级黄色在线播放|