基于神经耦合模型的异构词法数据转化和融合

为了扩大人工标注数据的规模,从而提高模型性能,尝试充分利用已有的异构人工标注数据训练模型参数.将Li等2015年提出的耦合序列标注方法扩展到基于BiLSTM的深度学习框架,直接在两个异构训练数据上训练参数,测试阶段则同时预测两个标签序列.在词性标注、分词词性联合标注两个任务上进行大量实验,结果表明,与多任务学习方法和传统耦合模型相比,神经耦合模型在利用词法异构数据方面更优越,在异构数据转化和融合两个场景上都取得更高的性能....

Full description

Saved in:
Bibliographic Details
Published in北京大学学报(自然科学版) Vol. 56; no. 1; pp. 97 - 104
Main Authors 黄德朋, 李正华, 龚晨, 张民
Format Journal Article
LanguageChinese
Published 苏州大学计算机科学与技术学院,苏州,215006 20.01.2020
Subjects
Online AccessGet full text
ISSN0479-8023
DOI10.13209/j.0479-8023.2019.098

Cover

More Information
Summary:为了扩大人工标注数据的规模,从而提高模型性能,尝试充分利用已有的异构人工标注数据训练模型参数.将Li等2015年提出的耦合序列标注方法扩展到基于BiLSTM的深度学习框架,直接在两个异构训练数据上训练参数,测试阶段则同时预测两个标签序列.在词性标注、分词词性联合标注两个任务上进行大量实验,结果表明,与多任务学习方法和传统耦合模型相比,神经耦合模型在利用词法异构数据方面更优越,在异构数据转化和融合两个场景上都取得更高的性能.
ISSN:0479-8023
DOI:10.13209/j.0479-8023.2019.098