摘要
提出了一种基于网格的参数自动化聚类算法PAG,主要目的是解决传统的网格聚类算法对参数敏感的问题.算法采用参数自动化技术来处理参数,即算法开始运行时所需的参数直接由参数自动化技术中的公式计算得出,不需要用户输入任何参数.通过对大量数据集的实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好地识别出孤立点或噪声,并且有很好的精度.
This paper presents a grid - based clustering algorithm by the parameter automatization(PAG). The purpose of PAG is to solve the problem that the traditional grid clustering algorithm relies on the parameter of algorithm. PAG does not need the user to input any parameter and it handles the parameter by the technique of parameter automatization. Scanning the dataset only once, the PAG can discover clusters of arbitrary shapes. The experiment results show that it can discover outliers or noises effectively and get good cluster quality.
出处
《郑州大学学报(工学版)》
CAS
2006年第2期91-93,共3页
Journal of Zhengzhou University(Engineering Science)
基金
河南省科技攻关资助项目(324220066)
郑州大学青年骨干教师基金资助项目
关键词
网格聚类
参数自动化
孤立点
grid clustering
parameter automatization
outlier