一种基于重叠社区标签传播的学科划分方法

[目的/意义]以Wikipedia为代表的网络百科全书收录了海量的概念.但在此类百科全书中,概念与概念之间、概念与学科之间以及学科与学科之间的关系缺乏明确的划分.这使得初步接触某一学科的查询者很难高效地系统性地获取该领域相关知识.[方法/过程]为获取某特定学科领域信息,更好地组织知识,本研究提出一种用于对各学科边界进行划分的方法.本研究将复杂网络分析方法引入文本主题划分领域,利用主题模型构建了主题文本网络,并在此基础上改进了重叠社区标签传播算法,实现学科领域的边界划分.[结果/结论]本研究以300个Wikipedia词条文本为样本,证明了该方法的有效性.通过多组实验,分析了词条网络的相关社团结...

Full description

Saved in:
Bibliographic Details
Published in农业图书情报学报 Vol. 33; no. 1; pp. 41 - 52
Main Authors 遆慧颖, 耿骞, 靳健
Format Journal Article
LanguageChinese
Published 中国农业科学院农业信息研究所 05.01.2021
北京师范大学政府管理学院,北京 100875
Subjects
Online AccessGet full text
ISSN1002-1248
DOI10.13998/j.cnki.issn1002-1248.20-0307

Cover

More Information
Summary:[目的/意义]以Wikipedia为代表的网络百科全书收录了海量的概念.但在此类百科全书中,概念与概念之间、概念与学科之间以及学科与学科之间的关系缺乏明确的划分.这使得初步接触某一学科的查询者很难高效地系统性地获取该领域相关知识.[方法/过程]为获取某特定学科领域信息,更好地组织知识,本研究提出一种用于对各学科边界进行划分的方法.本研究将复杂网络分析方法引入文本主题划分领域,利用主题模型构建了主题文本网络,并在此基础上改进了重叠社区标签传播算法,实现学科领域的边界划分.[结果/结论]本研究以300个Wikipedia词条文本为样本,证明了该方法的有效性.通过多组实验,分析了词条网络的相关社团结构以及学科领域的复杂性,为构建学科构建领域知识库奠定基础.
ISSN:1002-1248
DOI:10.13998/j.cnki.issn1002-1248.20-0307