使用谱聚类算法解决文本聚类集成问题

TP391; 采用2个不同的谱聚类算法解决文本聚类集成问题.为使算法可扩展到大规模应用,基于代数变换,通过求解小规模矩阵的特征值分解问题避免了大规模矩阵的特征值分解问题,有效降低了2个谱聚类算法的计算复杂度.分别从矩阵扰动理论和图上的随机游走的角度解释了2个算法的有效性.在真实文本集上的实验结果表明:提出的代数变换方法是有效的,该方法可以有效提高谱聚类算法的运行效率;该聚类集成谱算法比其他常见的聚类集成算法更优越、更高效,可以有效解决文本聚类集成问题....

Full description

Saved in:
Bibliographic Details
Published inTongxin Xuebao Vol. 31; no. 6; pp. 58 - 66
Main Authors 徐森, 卢志茂, 顾国昌
Format Journal Article
LanguageChinese
Published 盐城工学院,信息工程学院,江苏,盐城,224000%哈尔滨工程大学模式识别与自然计算研究室,黑龙江,哈尔滨,150001 2010
哈尔滨工程大学模式识别与自然计算研究室,黑龙江,哈尔滨,150001
Editorial Department of Journal on Communications
Subjects
Online AccessGet full text
ISSN1000-436X
DOI10.3969/j.issn.1000-436X.2010.06.009

Cover

More Information
Summary:TP391; 采用2个不同的谱聚类算法解决文本聚类集成问题.为使算法可扩展到大规模应用,基于代数变换,通过求解小规模矩阵的特征值分解问题避免了大规模矩阵的特征值分解问题,有效降低了2个谱聚类算法的计算复杂度.分别从矩阵扰动理论和图上的随机游走的角度解释了2个算法的有效性.在真实文本集上的实验结果表明:提出的代数变换方法是有效的,该方法可以有效提高谱聚类算法的运行效率;该聚类集成谱算法比其他常见的聚类集成算法更优越、更高效,可以有效解决文本聚类集成问题.
ISSN:1000-436X
DOI:10.3969/j.issn.1000-436X.2010.06.009