大规模中文具体度词典的构建及推理技术

针对中文词语具体度资源的匮乏,提出一种自动的中文词语具体度词典构造方法.该方法充分利用已有的英文词语具体度资源,基于在线翻译工具和预训练词向量,训练出中文词语具体度的多层感知器回归模型,构造大规模的中文词语具体度词典.为了评估该中文词语具体度词典的性能,设计两项基本的具体度推理任务:词语级具体度推理和句子级具体度推理,并通过人工标注的方式构造相应的评测数据集.实验结果表明构造的词语具体度词典可以有效地完成这两项推理任务....

Full description

Saved in:
Bibliographic Details
Published in北京大学学报(自然科学版) Vol. 58; no. 1; pp. 1 - 6
Main Authors 谢志鹏, 毕冉
Format Journal Article
LanguageChinese
Published 复旦大学计算机科学技术学院, 上海 200433 20.01.2022
Subjects
Online AccessGet full text
ISSN0479-8023
DOI10.13209/j.0479-8023.2021.100

Cover

More Information
Summary:针对中文词语具体度资源的匮乏,提出一种自动的中文词语具体度词典构造方法.该方法充分利用已有的英文词语具体度资源,基于在线翻译工具和预训练词向量,训练出中文词语具体度的多层感知器回归模型,构造大规模的中文词语具体度词典.为了评估该中文词语具体度词典的性能,设计两项基本的具体度推理任务:词语级具体度推理和句子级具体度推理,并通过人工标注的方式构造相应的评测数据集.实验结果表明构造的词语具体度词典可以有效地完成这两项推理任务.
ISSN:0479-8023
DOI:10.13209/j.0479-8023.2021.100