一种基于显式定位的机器阅读理解方法
TP181; 大多数机器阅读理解模型是基于具有各种注意力机制的端到端深度学习网络,但此类模型会损失句子级别的语义信息.此外,现有数据集中的问题通常不需要复杂的推理,并且答案仅与背景段落中的少量句子相关.基于此,提出将机器阅读理解模型划分为两层:第一层用于查找段落中与问题相关的句子并生成新的背景段落;第二层则根据减小了规模的段落做进一步的答案提取.实验结果表明,在定位了相关句子后预测性能有所提高.SQuAD阅读理解数据集也被划分为两部分,以适应新的框架训练需求,并使用新的数据集测试了相关内容的长度对机器阅读理解模型效果的影响....
Saved in:
| Published in | 郑州大学学报(理学版) Vol. 53; no. 3; pp. 37 - 49 |
|---|---|
| Main Authors | , , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
国防科技大学 计算机学院 湖南 长沙 410073
01.09.2021
|
| Subjects | |
| Online Access | Get full text |
| ISSN | 1671-6841 |
| DOI | 10.13705/j.issn.1671-6841.2020316 |
Cover
| Summary: | TP181; 大多数机器阅读理解模型是基于具有各种注意力机制的端到端深度学习网络,但此类模型会损失句子级别的语义信息.此外,现有数据集中的问题通常不需要复杂的推理,并且答案仅与背景段落中的少量句子相关.基于此,提出将机器阅读理解模型划分为两层:第一层用于查找段落中与问题相关的句子并生成新的背景段落;第二层则根据减小了规模的段落做进一步的答案提取.实验结果表明,在定位了相关句子后预测性能有所提高.SQuAD阅读理解数据集也被划分为两部分,以适应新的框架训练需求,并使用新的数据集测试了相关内容的长度对机器阅读理解模型效果的影响. |
|---|---|
| ISSN: | 1671-6841 |
| DOI: | 10.13705/j.issn.1671-6841.2020316 |