期刊文献+

基于网格的参数自动化聚类算法 被引量:14

Grid-based Clustering Algorithm with the Parameter Automatization
在线阅读 下载PDF
导出
摘要 提出了一种基于网格的参数自动化聚类算法PAG,主要目的是解决传统的网格聚类算法对参数敏感的问题.算法采用参数自动化技术来处理参数,即算法开始运行时所需的参数直接由参数自动化技术中的公式计算得出,不需要用户输入任何参数.通过对大量数据集的实验表明,该算法可扩展性好,能处理任意形状和大小的聚类,能够很好地识别出孤立点或噪声,并且有很好的精度. This paper presents a grid - based clustering algorithm by the parameter automatization(PAG). The purpose of PAG is to solve the problem that the traditional grid clustering algorithm relies on the parameter of algorithm. PAG does not need the user to input any parameter and it handles the parameter by the technique of parameter automatization. Scanning the dataset only once, the PAG can discover clusters of arbitrary shapes. The experiment results show that it can discover outliers or noises effectively and get good cluster quality.
出处 《郑州大学学报(工学版)》 CAS 2006年第2期91-93,共3页 Journal of Zhengzhou University(Engineering Science)
基金 河南省科技攻关资助项目(324220066) 郑州大学青年骨干教师基金资助项目
关键词 网格聚类 参数自动化 孤立点 grid clustering parameter automatization outlier
  • 相关文献

参考文献5

  • 1ESTER M, KRIEGEL H P, SANDER J, et al. A density- based algorithm for discovering clusters in large spatial databases with noise [ A ]. Proceeding of 2nd int Conf On Knowledge Discovery and Data Mining[ C ], Portland : AAAI Press, 1996. 226 - 231.
  • 2KARYPIS G, HAN E H, KUMAR V. Chameleon: A hierarchical clustering algorithm using dynamic modeling[J]. IEEE Computer,1999,32(8) :68 - 75.
  • 3GUHA S, RASTOGI R,SHIM K. CURE: An Efficient Clustering Algorithm for Large Databases [ C ]. New York :ACM Press, 1998.73 - 84.
  • 4ERTOZ L, STEINBACH M, KUMAR V. Finding Clusters of Different Sizes, Shapes, and Densities in Noisy, High Dimensional Data [ C ]. Canada: SIAM Press, 2003,2003.1 - 12.
  • 5HSU C M, CHEN M S. Subspace Clustering of High Dimensional Spatial Data with Noises [ C ]. Germany:Springer, 2004.31- 40.

同被引文献107

引证文献14

二级引证文献94

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部