基于預訓練模型的基層治理敏感實體識別方法
所屬分類:技術(shù)論文
上傳者:zhoubin333
文檔大?。?span>3658 K
標簽: 預訓練語言模型 基層治理 中文命名實體識別
所需積分:0分積分不夠怎么辦?
文檔介紹:基層治理產(chǎn)生的大量敏感數(shù)據(jù)可通過數(shù)據(jù)脫敏去除隱私內(nèi)容,但這些數(shù)據(jù)包含較多非結(jié)構(gòu)化文本數(shù)據(jù),難以直接進行數(shù)據(jù)脫敏。因此,需要對非結(jié)構(gòu)化文本數(shù)據(jù)進行命名實體識別以提取敏感數(shù)據(jù)。首先把敏感實體分為16類并對信訪文本進行標注,輸入層表示采用預訓練模型BERT,編碼層利用雙向長短時記憶網(wǎng)絡(luò)汲取上下文信息,解碼層通過條件隨機場模型優(yōu)化序列,構(gòu)建了較高精度的基層治理敏感實體識別模型。針對脫敏工作需要,改變假陰性和假陽性的loss權(quán)重,并采用敏感實體框選率輔助評價模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進行實驗,F(xiàn)1值分別為88.38%和90.11%,相較于基準模型提升了4.64%和3.78%。該模型可應用于非結(jié)構(gòu)化文本的敏感實體識別,識別成功率高?,F(xiàn)有評價指標未能較好地反映敏感實體的間接推理關(guān)系,應當探索更完善的敏感實體評價體系。
現(xiàn)在下載
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。
主站蜘蛛池模板: 欧美jizzhd精品欧美| 红楼遗梦成人h文完整版| 欧美日韩视频在线观看高清免费网站| 国产做受视频120秒试看| 96xxxxx日本人| 无码专区永久免费AV网站| 亚洲国产欧美另类| 第一次h圆房细致前戏| 国产伦理不卡伦理剧| 1313午夜精品理伦片| 李小璐三级在线视频| 免费a级毛片18以上观看精品| 2021国产成人精品国产| 引诱亲女乱小说| 久久国产精品免费看| 欧美日韩成人午夜免费| 免费观看女子推理社| 都流了这么多还嘴硬| 国产精品JIZZ在线观看无码| 99热这里有精品| 成人羞羞视频国产| 久久精品国产亚洲AV蜜臀色欲| 欧美日韩在线视频一区| 免费成人在线网站| 色偷偷av一区二区三区| 国产成人精品一区二区三区无码| 一边摸一边叫床一边爽| 日韩在线观看一区二区三区| 亚洲性久久久影院| 狠狠躁天天躁无码中文字幕图| 噼里啪啦免费观看高清动漫| 麻豆一精品传媒媒短视频下载| 国产精品成年片在线观看| aⅴ在线免费观看| 成人年无码AV片在线观看| 久久精品免费观看国产| 欧美亚洲色综久久精品国产| 亚洲综合无码一区二区三区| 精品国产18久久久久久| 国产精品免费播放 | 精品国产污污免费网站入口|