基于短语成分表示的中文关系抽取
TP391.1%TP183; 关系抽取是自然语言处理的重要研究内容,短语成分结构则是学界普遍认为能对关系抽取有重要影响的特征信息.然而目前短语成分应用于关系抽取任务时没有明显效果.这主要有两个原因:短语成分分析模型的泛化能力较差,会在关系抽取上造成错误传播,从而影响了它对关系抽取的有效性;关系抽取任务上使用短语成分特征的方式存在缺陷,即丧失短语成分分析学习到的句子结构信息,或者加大其对关系抽取的错误影响.本文在提升短语成分分析效果的基础上,提出了基于短语成分表示的中文关系抽取方法.该方法将短语成分分析模型学习到的文本表示嵌入到关系抽取模型中,从而提升关系抽取的性能.本文在公开的中文关系抽取数据...
Saved in:
Published in | 数据采集与处理 Vol. 35; no. 3; pp. 449 - 457 |
---|---|
Main Authors | , , , , , |
Format | Journal Article |
Language | Chinese |
Published |
复旦大学计算机科学技术学院,上海,201203
01.05.2020
上海智能电子与系统研究院,上海,201203%上海秘塔网络科技有限公司,上海,200135%微软亚洲研究院,北京,100080 |
Subjects | |
Online Access | Get full text |
ISSN | 1004-9037 |
DOI | 10.16337/j.1004-9037.2020.03.008 |
Cover
Summary: | TP391.1%TP183; 关系抽取是自然语言处理的重要研究内容,短语成分结构则是学界普遍认为能对关系抽取有重要影响的特征信息.然而目前短语成分应用于关系抽取任务时没有明显效果.这主要有两个原因:短语成分分析模型的泛化能力较差,会在关系抽取上造成错误传播,从而影响了它对关系抽取的有效性;关系抽取任务上使用短语成分特征的方式存在缺陷,即丧失短语成分分析学习到的句子结构信息,或者加大其对关系抽取的错误影响.本文在提升短语成分分析效果的基础上,提出了基于短语成分表示的中文关系抽取方法.该方法将短语成分分析模型学习到的文本表示嵌入到关系抽取模型中,从而提升关系抽取的性能.本文在公开的中文关系抽取数据集上验证了该方法的有效性. |
---|---|
ISSN: | 1004-9037 |
DOI: | 10.16337/j.1004-9037.2020.03.008 |