基于詞匯增強和表格填充的中文命名實體識別 | |
所屬分類:技術論文 | |
上傳者:wwei | |
文檔大小:3582 K | |
標簽: 詞匯增強 中文命名實體識別 表格填充 | |
所需積分:0分積分不夠怎么辦? | |
文檔介紹:中文命名實體識別主要包括中文平面命名實體識別和中文嵌套命名實體識別兩個任務,其中中文嵌套命名實體識別任務難度更大。提出了一個基于詞匯增強和表格填充的統一模型TLEXNER,該模型能夠同時處理上述任務。該模型首先針對中文語料分詞困難的問題,使用詞典適配器將詞匯信息融合到BERT預訓練模型,并且將字符與詞匯組的相對位置信息集成到BERT的嵌入層中;然后通過條件層歸一化和雙仿射模型構造并預測字符對表格,使用表格建模字符與字符之間的關系,得到平面實體與嵌套實體的統一表示;最后根據字符對表格上三角區域的數值判斷實體類別。提出的模型在平面實體的公開數據集Resume和自行標注的軍事領域嵌套實體數據集上F1分別是97.35%和91.96%,證明了TLEXNER模型的有效性。 | |
現在下載 | |
VIP會員,AET專家下載不扣分;重復下載不扣分,本人上傳資源不扣分。 |
Copyright ? 2005-2024 華北計算機系統工程研究所版權所有 京ICP備10017138號-2