面向主题检索的科技政策扩散识别方法

TP181; 为满足用户对某一主题下科技政策扩散关系挖掘的分析需求,构建了科技政策扩散识别模型.通过从科技政策文本中提取组织结构相似性特征、语义结构相似性特征、关键词承继性特征及基于Doc2vec的文本相似性特征,实现多个特征的一体化处理;提出了基于识别模型评分的科技政策文本距离计算方法,根据政策间的文本距离与扩散概率的关系,寻找使扩散关系成立的最大文本距离,并将扩散经验值融入识别模型中,实现检索过程中科技政策扩散对和扩散集的自动计算和输出.实验结果表明,所构建的科技政策扩散识别框架能有效地提取出扩散集合....

Full description

Saved in:
Bibliographic Details
Published in郑州大学学报(理学版) Vol. 54; no. 5; pp. 82 - 89
Main Authors 曾立英, 许乾坤, 张丽颖, 刘耀
Format Journal Article
LanguageChinese
Published 中央民族大学 国际教育学院 北京 100081%中国科学技术信息研究所 北京 100038%河北省工业和信息化厅 河北 石家庄 050017 01.09.2022
Subjects
Online AccessGet full text
ISSN1671-6841
DOI10.13705/j.issn.1671-6841.2022060

Cover

More Information
Summary:TP181; 为满足用户对某一主题下科技政策扩散关系挖掘的分析需求,构建了科技政策扩散识别模型.通过从科技政策文本中提取组织结构相似性特征、语义结构相似性特征、关键词承继性特征及基于Doc2vec的文本相似性特征,实现多个特征的一体化处理;提出了基于识别模型评分的科技政策文本距离计算方法,根据政策间的文本距离与扩散概率的关系,寻找使扩散关系成立的最大文本距离,并将扩散经验值融入识别模型中,实现检索过程中科技政策扩散对和扩散集的自动计算和输出.实验结果表明,所构建的科技政策扩散识别框架能有效地提取出扩散集合.
ISSN:1671-6841
DOI:10.13705/j.issn.1671-6841.2022060