信息安全领域内实体共指消解技术研究

TP393; 针对信息安全领域内的共指消解问题,提出了一个混合型方法.该方法在原来BiLSTM-attention-CRF模型的基础上引入领域词典匹配机制,将其与文档层面的注意力机制相结合,作为一种新的基于字典的注意力机制,来解决从文本中提取候选词时对稀有实体以及长度较长的实体识别能力稍弱的问题,并通过总结领域文本特征,将提取出的待消解候选词根据词性分别采用规则与机器学习的方式进行消解,以提高准确性.通过在安全领域数据集的实验,分别从共指消解以及提取候选词并分类2个方面证明了方法的优越性....

Full description

Saved in:
Bibliographic Details
Published in通信学报 Vol. 41; no. 2; pp. 165 - 175
Main Authors 张晗, 胡永进, 郭渊博, 陈吉成
Format Journal Article
LanguageChinese
Published 郑州大学软件学院,河南郑州 450000%信息工程大学密码工程学院,河南郑州,450001%信息工程大学信息技术研究所,河南郑州,450001 25.02.2020
信息工程大学密码工程学院,河南郑州 450001
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.11959/j.issn.1000-436x.2020033

Cover

More Information
Summary:TP393; 针对信息安全领域内的共指消解问题,提出了一个混合型方法.该方法在原来BiLSTM-attention-CRF模型的基础上引入领域词典匹配机制,将其与文档层面的注意力机制相结合,作为一种新的基于字典的注意力机制,来解决从文本中提取候选词时对稀有实体以及长度较长的实体识别能力稍弱的问题,并通过总结领域文本特征,将提取出的待消解候选词根据词性分别采用规则与机器学习的方式进行消解,以提高准确性.通过在安全领域数据集的实验,分别从共指消解以及提取候选词并分类2个方面证明了方法的优越性.
ISSN:1000-436X
DOI:10.11959/j.issn.1000-436x.2020033