數(shù)據(jù)中心最新文章

基于預(yù)訓(xùn)練模型的基層治理敏感實(shí)體識(shí)別方法

基層治理產(chǎn)生的大量敏感數(shù)據(jù)可通過數(shù)據(jù)脫敏去除隱私內(nèi)容,但這些數(shù)據(jù)包含較多非結(jié)構(gòu)化文本數(shù)據(jù),難以直接進(jìn)行數(shù)據(jù)脫敏。因此,需要對(duì)非結(jié)構(gòu)化文本數(shù)據(jù)進(jìn)行命名實(shí)體識(shí)別以提取敏感數(shù)據(jù)。首先把敏感實(shí)體分為16類并對(duì)信訪文本進(jìn)行標(biāo)注,輸入層表示采用預(yù)訓(xùn)練模型BERT,編碼層利用雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)汲取上下文信息,解碼層通過條件隨機(jī)場(chǎng)模型優(yōu)化序列,構(gòu)建了較高精度的基層治理敏感實(shí)體識(shí)別模型。針對(duì)脫敏工作需要,改變假陰性和假陽性的loss權(quán)重,并采用敏感實(shí)體框選率輔助評(píng)價(jià)模型性能。在基層治理信訪數(shù)據(jù)集和公共數(shù)據(jù)集MSRA上進(jìn)行實(shí)驗(yàn),F(xiàn)1值分別為88.38%和90.11%,相較于基準(zhǔn)模型提升了4.64%和3.78%。該模型可應(yīng)用于非結(jié)構(gòu)化文本的敏感實(shí)體識(shí)別,識(shí)別成功率高。現(xiàn)有評(píng)價(jià)指標(biāo)未能較好地反映敏感實(shí)體的間接推理關(guān)系,應(yīng)當(dāng)探索更完善的敏感實(shí)體評(píng)價(jià)體系。

發(fā)表于:9/25/2023

主站蜘蛛池模板: 黄无遮挡免费网站视频| 两根硕大一起挤进小h| 狠狠爱天天综合色欲网| 国产亚洲精彩视频| 2018天天操天天干| 妞干网手机免费视频| 久久精品国产99国产精品澳门 | 女大学生的沙龙室| 久久国产精品免费看| 欧美最猛黑人猛交69| 北条麻妃大战黑人| 高清不卡免费一区二区三区| 国内自拍视频一区二区三区| 两个漂亮女百合啪啪水声| 日韩精品一区二区三区毛片| 亚洲欧洲综合在线| 精品一区二区三区免费毛片| 国产乱子伦片免费观看中字| 2020国产精品自拍| 在线看欧美日韩中文字幕| 丝袜人妻一区二区三区网站| 日本高清免费看| 亚洲国产成人精品无码区在线观看 | 国产内射在线激情一区| 一级片网站在线观看| 最近中文字幕免费mv视频7| 亚洲精品国产电影| 精品综合久久久久久99| 国产在线资源站| 男女抽搐一进一出无遮挡| 在线观看日韩视频| 一级特黄特色的免费大片视频| 日本边添边摸边做边爱的网站 | 韩国精品一区视频在线播放| 国产精彩视频在线| www.色亚洲| 成年女人免费碰碰视频| 久久国产热视频| 欧美午夜艳片欧美精品| 亚洲的天堂av无码| 男女裸体影院高潮|