融合词信息嵌入的注意力自适应命名实体识别

TP391; 缺少分词信息及未登录词、无关词干扰是字符级中文命名实体识别面临的主要问题,提出了融合词信息嵌入的注意力自适应中文命名实体识别模型,在新词发现的基础上,将字向量嵌入与词级信息嵌入融合作为模型输入,减少了未登录词对模型的影响,并增强了实体特征的显著性,使实体特征更容易被学习器获取;同时,在注意力机制中引入动态缩放因子,自适应地调整相关实体和无关词的注意力分布,一定程度上减小了无关词对模型的干扰.将该方法在公共数据集上进行实验,实验结果证明了方法的有效性....

Full description

Saved in:
Bibliographic Details
Published in计算机工程与应用 Vol. 59; no. 8; pp. 167 - 174
Main Authors 赵萍, 窦全胜, 唐焕玲, 姜平, 陈淑振
Format Journal Article
LanguageChinese
Published 喀什大学 计算机科学与技术学院,新疆 喀什 844008 15.04.2023
山东工商学院 信息与电子工程学院,山东 烟台 264005%喀什大学 计算机科学与技术学院,新疆 喀什 844008
山东省高等学校协同创新中心:未来智能计算机,山东 烟台 264005%山东工商学院 计算机科学与技术学院,山东 烟台 264005
山东工商学院 计算机科学与技术学院,山东 烟台 264005
Subjects
Online AccessGet full text
ISSN1002-8331
DOI10.3778/j.issn.1002-8331.2112-0193

Cover

More Information
Summary:TP391; 缺少分词信息及未登录词、无关词干扰是字符级中文命名实体识别面临的主要问题,提出了融合词信息嵌入的注意力自适应中文命名实体识别模型,在新词发现的基础上,将字向量嵌入与词级信息嵌入融合作为模型输入,减少了未登录词对模型的影响,并增强了实体特征的显著性,使实体特征更容易被学习器获取;同时,在注意力机制中引入动态缩放因子,自适应地调整相关实体和无关词的注意力分布,一定程度上减小了无关词对模型的干扰.将该方法在公共数据集上进行实验,实验结果证明了方法的有效性.
ISSN:1002-8331
DOI:10.3778/j.issn.1002-8331.2112-0193