基于神经耦合模型的异构词法数据转化和融合

为了扩大人工标注数据的规模,从而提高模型性能,尝试充分利用已有的异构人工标注数据训练模型参数.将Li等2015年提出的耦合序列标注方法扩展到基于BiLSTM的深度学习框架,直接在两个异构训练数据上训练参数,测试阶段则同时预测两个标签序列.在词性标注、分词词性联合标注两个任务上进行大量实验,结果表明,与多任务学习方法和传统耦合模型相比,神经耦合模型在利用词法异构数据方面更优越,在异构数据转化和融合两个场景上都取得更高的性能....

Full description

Saved in:

Bibliographic Details
Published in	北京大学学报（自然科学版） Vol. 56; no. 1; pp. 97 - 104
Main Authors	黄德朋, 李正华, 龚晨, 张民
Format	Journal Article
Language	Chinese
Published	苏州大学计算机科学与技术学院,苏州,215006 20.01.2020
Subjects	词性标注 BiLSTM 耦合模型分词深度学习
Online Access	Get full text
ISSN	0479-8023
DOI	10.13209/j.0479-8023.2019.098

Cover

More Information
Summary:	为了扩大人工标注数据的规模,从而提高模型性能,尝试充分利用已有的异构人工标注数据训练模型参数.将Li等2015年提出的耦合序列标注方法扩展到基于BiLSTM的深度学习框架,直接在两个异构训练数据上训练参数,测试阶段则同时预测两个标签序列.在词性标注、分词词性联合标注两个任务上进行大量实验,结果表明,与多任务学习方法和传统耦合模型相比,神经耦合模型在利用词法异构数据方面更优越,在异构数据转化和融合两个场景上都取得更高的性能.
ISSN:	0479-8023
DOI:	10.13209/j.0479-8023.2019.098