基于层次的K—means初始化算法

K—means算法是一种常用的聚类算法,但是聚类中心的初始化是其中的一个难点。笔者提出了一个基于层次思想的初始化方法。一般聚类问题均可看作加权聚类,通过层层抽样减少数据量,然后采用自顶向下的方式,从抽样结束层到原始数据层,每层都进行聚类,其中每层初始聚类中心均通过对上层聚类中心进行换算得到,重复该过程直到原始数据层,可得原始数据层的初始聚类中心。模拟数据和真实数据的实验结果均显示基于层次抽样初始化的K—means算法不仅收敛速度快、聚类质量高,而且对噪声不敏感,其性能明显优于现有的相关算法。...

Full description

Saved in:
Bibliographic Details
Published in中国工程科学 Vol. 9; no. 11; pp. 74 - 79
Main Author 汤九斌 陆建峰 唐振民 杨静宇
Format Journal Article
LanguageChinese
Published 中国工程院战略咨询中心 01.11.2007
高等教育出版社有限公司
南京理工大学计算机系,南京,210094
Subjects
Online AccessGet full text
ISSN1009-1742
DOI10.3969/j.issn.1009-1742.2007.11.013

Cover

More Information
Summary:K—means算法是一种常用的聚类算法,但是聚类中心的初始化是其中的一个难点。笔者提出了一个基于层次思想的初始化方法。一般聚类问题均可看作加权聚类,通过层层抽样减少数据量,然后采用自顶向下的方式,从抽样结束层到原始数据层,每层都进行聚类,其中每层初始聚类中心均通过对上层聚类中心进行换算得到,重复该过程直到原始数据层,可得原始数据层的初始聚类中心。模拟数据和真实数据的实验结果均显示基于层次抽样初始化的K—means算法不仅收敛速度快、聚类质量高,而且对噪声不敏感,其性能明显优于现有的相关算法。
ISSN:1009-1742
DOI:10.3969/j.issn.1009-1742.2007.11.013