基于短语成分表示的中文关系抽取

TP391.1%TP183; 关系抽取是自然语言处理的重要研究内容,短语成分结构则是学界普遍认为能对关系抽取有重要影响的特征信息.然而目前短语成分应用于关系抽取任务时没有明显效果.这主要有两个原因:短语成分分析模型的泛化能力较差,会在关系抽取上造成错误传播,从而影响了它对关系抽取的有效性;关系抽取任务上使用短语成分特征的方式存在缺陷,即丧失短语成分分析学习到的句子结构信息,或者加大其对关系抽取的错误影响.本文在提升短语成分分析效果的基础上,提出了基于短语成分表示的中文关系抽取方法.该方法将短语成分分析模型学习到的文本表示嵌入到关系抽取模型中,从而提升关系抽取的性能.本文在公开的中文关系抽取数据...

Full description

Saved in:
Bibliographic Details
Published in数据采集与处理 Vol. 35; no. 3; pp. 449 - 457
Main Authors 刘娜娜, 程婧, 闵可锐, 康昱, 王新, 周扬帆
Format Journal Article
LanguageChinese
Published 复旦大学计算机科学技术学院,上海,201203 01.05.2020
上海智能电子与系统研究院,上海,201203%上海秘塔网络科技有限公司,上海,200135%微软亚洲研究院,北京,100080
Subjects
Online AccessGet full text
ISSN1004-9037
DOI10.16337/j.1004-9037.2020.03.008

Cover

More Information
Summary:TP391.1%TP183; 关系抽取是自然语言处理的重要研究内容,短语成分结构则是学界普遍认为能对关系抽取有重要影响的特征信息.然而目前短语成分应用于关系抽取任务时没有明显效果.这主要有两个原因:短语成分分析模型的泛化能力较差,会在关系抽取上造成错误传播,从而影响了它对关系抽取的有效性;关系抽取任务上使用短语成分特征的方式存在缺陷,即丧失短语成分分析学习到的句子结构信息,或者加大其对关系抽取的错误影响.本文在提升短语成分分析效果的基础上,提出了基于短语成分表示的中文关系抽取方法.该方法将短语成分分析模型学习到的文本表示嵌入到关系抽取模型中,从而提升关系抽取的性能.本文在公开的中文关系抽取数据集上验证了该方法的有效性.
ISSN:1004-9037
DOI:10.16337/j.1004-9037.2020.03.008