面向主题检索的科技政策扩散识别方法
TP181; 为满足用户对某一主题下科技政策扩散关系挖掘的分析需求,构建了科技政策扩散识别模型.通过从科技政策文本中提取组织结构相似性特征、语义结构相似性特征、关键词承继性特征及基于Doc2vec的文本相似性特征,实现多个特征的一体化处理;提出了基于识别模型评分的科技政策文本距离计算方法,根据政策间的文本距离与扩散概率的关系,寻找使扩散关系成立的最大文本距离,并将扩散经验值融入识别模型中,实现检索过程中科技政策扩散对和扩散集的自动计算和输出.实验结果表明,所构建的科技政策扩散识别框架能有效地提取出扩散集合....
        Saved in:
      
    
          | Published in | 郑州大学学报(理学版) Vol. 54; no. 5; pp. 82 - 89 | 
|---|---|
| Main Authors | , , , | 
| Format | Journal Article | 
| Language | Chinese | 
| Published | 
            中央民族大学 国际教育学院 北京 100081%中国科学技术信息研究所 北京 100038%河北省工业和信息化厅 河北 石家庄 050017
    
        01.09.2022
     | 
| Subjects | |
| Online Access | Get full text | 
| ISSN | 1671-6841 | 
| DOI | 10.13705/j.issn.1671-6841.2022060 | 
Cover
| Summary: | TP181; 为满足用户对某一主题下科技政策扩散关系挖掘的分析需求,构建了科技政策扩散识别模型.通过从科技政策文本中提取组织结构相似性特征、语义结构相似性特征、关键词承继性特征及基于Doc2vec的文本相似性特征,实现多个特征的一体化处理;提出了基于识别模型评分的科技政策文本距离计算方法,根据政策间的文本距离与扩散概率的关系,寻找使扩散关系成立的最大文本距离,并将扩散经验值融入识别模型中,实现检索过程中科技政策扩散对和扩散集的自动计算和输出.实验结果表明,所构建的科技政策扩散识别框架能有效地提取出扩散集合. | 
|---|---|
| ISSN: | 1671-6841 | 
| DOI: | 10.13705/j.issn.1671-6841.2022060 |