一种基于显式定位的机器阅读理解方法

TP181; 大多数机器阅读理解模型是基于具有各种注意力机制的端到端深度学习网络,但此类模型会损失句子级别的语义信息.此外,现有数据集中的问题通常不需要复杂的推理,并且答案仅与背景段落中的少量句子相关.基于此,提出将机器阅读理解模型划分为两层:第一层用于查找段落中与问题相关的句子并生成新的背景段落;第二层则根据减小了规模的段落做进一步的答案提取.实验结果表明,在定位了相关句子后预测性能有所提高.SQuAD阅读理解数据集也被划分为两部分,以适应新的框架训练需求,并使用新的数据集测试了相关内容的长度对机器阅读理解模型效果的影响....

Full description

Saved in:
Bibliographic Details
Published in郑州大学学报(理学版) Vol. 53; no. 3; pp. 37 - 49
Main Authors 邓超宇, 赵山, 肖晓强, 蔡志平
Format Journal Article
LanguageChinese
Published 国防科技大学 计算机学院 湖南 长沙 410073 01.09.2021
Subjects
Online AccessGet full text
ISSN1671-6841
DOI10.13705/j.issn.1671-6841.2020316

Cover

More Information
Summary:TP181; 大多数机器阅读理解模型是基于具有各种注意力机制的端到端深度学习网络,但此类模型会损失句子级别的语义信息.此外,现有数据集中的问题通常不需要复杂的推理,并且答案仅与背景段落中的少量句子相关.基于此,提出将机器阅读理解模型划分为两层:第一层用于查找段落中与问题相关的句子并生成新的背景段落;第二层则根据减小了规模的段落做进一步的答案提取.实验结果表明,在定位了相关句子后预测性能有所提高.SQuAD阅读理解数据集也被划分为两部分,以适应新的框架训练需求,并使用新的数据集测试了相关内容的长度对机器阅读理解模型效果的影响.
ISSN:1671-6841
DOI:10.13705/j.issn.1671-6841.2020316