基于局部增强的中文医疗命名实体识别模型

TP391.1; 医学实体的识别往往受到其相邻上下文的影响,目前的命名实体识别方法通常依赖于BiLSTM捕捉文本中的全局依赖关系,缺乏对字符之间局部依赖关系的建模.针对这一问题,提出了一种基于局部增强的中文医疗命名实体识别模型LENER.首先,LENER使用包括字音、字形和语义在内的多源信息来丰富底层字符表征.然后,结合相对位置编码对滑动窗口划分出的序列片段进行局部注意力计算,并通过非线性计算融合局部信息和BiLSTM得到的全局信息.最后,对识别出的实体头部和尾部进行组合,进而提取出实体.实验结果表明,LENER模型具有良好的实体识别能力,与其他模型相比,LENER模型的F1值提升了0.5%~...

Full description

Saved in:
Bibliographic Details
Published in通信学报 Vol. 45; no. 7; pp. 171 - 183
Main Authors 陈晶, 邢珂萱, 孟伟伦, 郭景峰, 冯建周
Format Journal Article
LanguageChinese
Published 广东海洋大学数学与计算机学院,广东 湛江 524088 01.07.2024
燕山大学信息科学与工程学院,河北 秦皇岛 066004%燕山大学信息科学与工程学院,河北 秦皇岛 066004
河北省计算机虚拟技术与系统集成重点实验室,河北 秦皇岛 066004%河北省计算机虚拟技术与系统集成重点实验室,河北 秦皇岛 066004
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.11959/j.issn.1000-436x.2024117

Cover

More Information
Summary:TP391.1; 医学实体的识别往往受到其相邻上下文的影响,目前的命名实体识别方法通常依赖于BiLSTM捕捉文本中的全局依赖关系,缺乏对字符之间局部依赖关系的建模.针对这一问题,提出了一种基于局部增强的中文医疗命名实体识别模型LENER.首先,LENER使用包括字音、字形和语义在内的多源信息来丰富底层字符表征.然后,结合相对位置编码对滑动窗口划分出的序列片段进行局部注意力计算,并通过非线性计算融合局部信息和BiLSTM得到的全局信息.最后,对识别出的实体头部和尾部进行组合,进而提取出实体.实验结果表明,LENER模型具有良好的实体识别能力,与其他模型相比,LENER模型的F1值提升了0.5%~2.0%.
ISSN:1000-436X
DOI:10.11959/j.issn.1000-436x.2024117