摘要
聚类分析是数据挖掘的一个重要运用方法,它是一个把数据对象划分成子集的过程。k-means算法是一个基于划分且应用非常广泛的聚类算法,具有原理简单、便于理解和实现、能处理大数据集等优点。但是,该算法也存在着一些不可避免的缺点,本论述针对在多维空间k-means算法中聚类数需要事先给定以及该算法对初始中心点选取的敏感性这两方面的缺点给出了改进算法,并选取数据集对改进算法进行试验。结果表明笔者提出的改进算法比传统的k-means算法和基于最大最小距离算法的k-means聚类算法具有更高的有效性和稳定性。
出处
《甘肃科技纵横》
2017年第3期68-70,83,共4页
Scientific & Technical Information of Gansu