大规模中文具体度词典的构建及推理技术
针对中文词语具体度资源的匮乏,提出一种自动的中文词语具体度词典构造方法.该方法充分利用已有的英文词语具体度资源,基于在线翻译工具和预训练词向量,训练出中文词语具体度的多层感知器回归模型,构造大规模的中文词语具体度词典.为了评估该中文词语具体度词典的性能,设计两项基本的具体度推理任务:词语级具体度推理和句子级具体度推理,并通过人工标注的方式构造相应的评测数据集.实验结果表明构造的词语具体度词典可以有效地完成这两项推理任务....
Saved in:
Published in | 北京大学学报(自然科学版) Vol. 58; no. 1; pp. 1 - 6 |
---|---|
Main Authors | , |
Format | Journal Article |
Language | Chinese |
Published |
复旦大学计算机科学技术学院, 上海 200433
20.01.2022
|
Subjects | |
Online Access | Get full text |
ISSN | 0479-8023 |
DOI | 10.13209/j.0479-8023.2021.100 |
Cover
Summary: | 针对中文词语具体度资源的匮乏,提出一种自动的中文词语具体度词典构造方法.该方法充分利用已有的英文词语具体度资源,基于在线翻译工具和预训练词向量,训练出中文词语具体度的多层感知器回归模型,构造大规模的中文词语具体度词典.为了评估该中文词语具体度词典的性能,设计两项基本的具体度推理任务:词语级具体度推理和句子级具体度推理,并通过人工标注的方式构造相应的评测数据集.实验结果表明构造的词语具体度词典可以有效地完成这两项推理任务. |
---|---|
ISSN: | 0479-8023 |
DOI: | 10.13209/j.0479-8023.2021.100 |