基于深度学习的命名实体识别研究
TP391; 针对先进制造业多模态异构数据并存导致知识抽取和表示困难等问题,命名实体识别方法成为当前的研究热点.综述了工业上常用的命名实体识别方法,首先介绍了传统的命名实体识别方法,然后阐述了已成为命名实体识别领域主流的基于深度学习方法,从分布式输入表示、上下文编码和标签解码器3个步骤分别对常用方法进行了分类和分析.鉴于基于深度学习方法的研究侧重于分布式输入表示和文本上下文编码模型的设计与改进,对分布式输入表示的各种方法进行了对比,指出其优缺点;对文本上下文编码模型从捕获长距离依赖、局部上下文信息、并行性、信息损失程度、可迁移性等方面进行了对比,指出各模型的特点.最后指出未来需要应对的挑战和研...
Saved in:
| Published in | 计算机集成制造系统 no. 6; pp. 1603 - 1615 |
|---|---|
| Main Authors | , , , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
北京交通大学 软件学院,北京 100044%中国科学院 软件研究所,北京 100190%中科蓝智(武汉)科技有限公司,湖北 武汉 430079
30.06.2022
|
| Subjects | |
| Online Access | Get full text |
| ISSN | 1006-5911 |
| DOI | 10.13196/j.cims.2022.06.001 |
Cover
| Summary: | TP391; 针对先进制造业多模态异构数据并存导致知识抽取和表示困难等问题,命名实体识别方法成为当前的研究热点.综述了工业上常用的命名实体识别方法,首先介绍了传统的命名实体识别方法,然后阐述了已成为命名实体识别领域主流的基于深度学习方法,从分布式输入表示、上下文编码和标签解码器3个步骤分别对常用方法进行了分类和分析.鉴于基于深度学习方法的研究侧重于分布式输入表示和文本上下文编码模型的设计与改进,对分布式输入表示的各种方法进行了对比,指出其优缺点;对文本上下文编码模型从捕获长距离依赖、局部上下文信息、并行性、信息损失程度、可迁移性等方面进行了对比,指出各模型的特点.最后指出未来需要应对的挑战和研究方向. |
|---|---|
| ISSN: | 1006-5911 |
| DOI: | 10.13196/j.cims.2022.06.001 |