使用谱聚类算法解决文本聚类集成问题
TP391; 采用2个不同的谱聚类算法解决文本聚类集成问题.为使算法可扩展到大规模应用,基于代数变换,通过求解小规模矩阵的特征值分解问题避免了大规模矩阵的特征值分解问题,有效降低了2个谱聚类算法的计算复杂度.分别从矩阵扰动理论和图上的随机游走的角度解释了2个算法的有效性.在真实文本集上的实验结果表明:提出的代数变换方法是有效的,该方法可以有效提高谱聚类算法的运行效率;该聚类集成谱算法比其他常见的聚类集成算法更优越、更高效,可以有效解决文本聚类集成问题....
Saved in:
| Published in | Tongxin Xuebao Vol. 31; no. 6; pp. 58 - 66 |
|---|---|
| Main Authors | , , |
| Format | Journal Article |
| Language | Chinese |
| Published |
盐城工学院,信息工程学院,江苏,盐城,224000%哈尔滨工程大学模式识别与自然计算研究室,黑龙江,哈尔滨,150001
2010
哈尔滨工程大学模式识别与自然计算研究室,黑龙江,哈尔滨,150001 Editorial Department of Journal on Communications |
| Subjects | |
| Online Access | Get full text |
| ISSN | 1000-436X |
| DOI | 10.3969/j.issn.1000-436X.2010.06.009 |
Cover
| Summary: | TP391; 采用2个不同的谱聚类算法解决文本聚类集成问题.为使算法可扩展到大规模应用,基于代数变换,通过求解小规模矩阵的特征值分解问题避免了大规模矩阵的特征值分解问题,有效降低了2个谱聚类算法的计算复杂度.分别从矩阵扰动理论和图上的随机游走的角度解释了2个算法的有效性.在真实文本集上的实验结果表明:提出的代数变换方法是有效的,该方法可以有效提高谱聚类算法的运行效率;该聚类集成谱算法比其他常见的聚类集成算法更优越、更高效,可以有效解决文本聚类集成问题. |
|---|---|
| ISSN: | 1000-436X |
| DOI: | 10.3969/j.issn.1000-436X.2010.06.009 |