基于神经耦合模型的异构词法数据转化和融合
为了扩大人工标注数据的规模,从而提高模型性能,尝试充分利用已有的异构人工标注数据训练模型参数.将Li等2015年提出的耦合序列标注方法扩展到基于BiLSTM的深度学习框架,直接在两个异构训练数据上训练参数,测试阶段则同时预测两个标签序列.在词性标注、分词词性联合标注两个任务上进行大量实验,结果表明,与多任务学习方法和传统耦合模型相比,神经耦合模型在利用词法异构数据方面更优越,在异构数据转化和融合两个场景上都取得更高的性能....
Saved in:
| Published in | 北京大学学报(自然科学版) Vol. 56; no. 1; pp. 97 - 104 |
|---|---|
| Main Authors | , , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
苏州大学计算机科学与技术学院,苏州,215006
20.01.2020
|
| Subjects | |
| Online Access | Get full text |
| ISSN | 0479-8023 |
| DOI | 10.13209/j.0479-8023.2019.098 |
Cover
| Summary: | 为了扩大人工标注数据的规模,从而提高模型性能,尝试充分利用已有的异构人工标注数据训练模型参数.将Li等2015年提出的耦合序列标注方法扩展到基于BiLSTM的深度学习框架,直接在两个异构训练数据上训练参数,测试阶段则同时预测两个标签序列.在词性标注、分词词性联合标注两个任务上进行大量实验,结果表明,与多任务学习方法和传统耦合模型相比,神经耦合模型在利用词法异构数据方面更优越,在异构数据转化和融合两个场景上都取得更高的性能. |
|---|---|
| ISSN: | 0479-8023 |
| DOI: | 10.13209/j.0479-8023.2019.098 |