面向主题检索的科技政策扩散识别方法

TP181; 为满足用户对某一主题下科技政策扩散关系挖掘的分析需求,构建了科技政策扩散识别模型.通过从科技政策文本中提取组织结构相似性特征、语义结构相似性特征、关键词承继性特征及基于Doc2vec的文本相似性特征,实现多个特征的一体化处理;提出了基于识别模型评分的科技政策文本距离计算方法,根据政策间的文本距离与扩散概率的关系,寻找使扩散关系成立的最大文本距离,并将扩散经验值融入识别模型中,实现检索过程中科技政策扩散对和扩散集的自动计算和输出.实验结果表明,所构建的科技政策扩散识别框架能有效地提取出扩散集合....

Full description

Saved in:

Bibliographic Details
Published in	郑州大学学报（理学版） Vol. 54; no. 5; pp. 82 - 89
Main Authors	曾立英, 许乾坤, 张丽颖, 刘耀
Format	Journal Article
Language	Chinese
Published	中央民族大学国际教育学院北京 100081%中国科学技术信息研究所北京 100038%河北省工业和信息化厅河北石家庄 050017 01.09.2022
Subjects	政策扩散科技政策文本挖掘文本分析扩散特征主题检索
Online Access	Get full text
ISSN	1671-6841
DOI	10.13705/j.issn.1671-6841.2022060

Cover

More Information
Summary:	TP181; 为满足用户对某一主题下科技政策扩散关系挖掘的分析需求,构建了科技政策扩散识别模型.通过从科技政策文本中提取组织结构相似性特征、语义结构相似性特征、关键词承继性特征及基于Doc2vec的文本相似性特征,实现多个特征的一体化处理;提出了基于识别模型评分的科技政策文本距离计算方法,根据政策间的文本距离与扩散概率的关系,寻找使扩散关系成立的最大文本距离,并将扩散经验值融入识别模型中,实现检索过程中科技政策扩散对和扩散集的自动计算和输出.实验结果表明,所构建的科技政策扩散识别框架能有效地提取出扩散集合.
ISSN:	1671-6841
DOI:	10.13705/j.issn.1671-6841.2022060