基于自适应权重的粗糙K均值聚类算法被引量：12

Rough K-means Clustering Based on Self-adaptive Weights

下载PDF

导出

摘要原有Rough K-means算法中类的上、下近似采用固定经验权重,其科学性值得商榷,针对这一问题,设计了一种基于自适应权重的粗糙K均值聚类算法。基于自适应权重的粗糙聚类算法在每一次迭代过程中,根据当前的数据划分状态,动态计算每个样本对于类的权重,降低了原有算法对初始权重的依赖。此外,该算法采用近似集合中的高斯距离比例来表现样本权重,从而可以在多种数据分布上得到更精确的聚类结果。实验结果表明,基于自适应权重的粗糙K均值算法是一种较优的聚类算法。 The fixed weights are adopted in the traditional rough K-means algorithm to represent the different approximations of the clusters,but it is always difficult to predefine the optimal weights with little priori knowledge before clustering.Therefore,an improved rough K-means algorithm based on self-adaptive weights was proposed in this paper.The new method computes the weights for every data according to the current clustering state and no more does rely on the initial weights.Furthermore,the self-adaptive weights are obtained from the Gaussian distance ration in cluster approximation,which can lead to the more accurate clustering results.The experiments indicate that the rough K-means based on self-adaptive weights is an effective rough clustering algorithm.

作者周杨苗夺谦岳晓冬

机构地区同济大学电子与信息工程学院同济大学嵌入式系统与服务计算教育部重点实验室国家高性能计算机工程中心同济分中心

出处《计算机科学》 CSCD 北大核心 2011年第6期237-241,共5页 Computer Science

基金国家自然科学基金(60475019 60970061)资助

关键词聚类粗糙集粗糙K均值自适应权重 Clustering Rough sets Rough K-means Self-adaptive weight

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献20

1Xu Rui. Donald Wunsch II. Survey of clustering algorithm [J]. IEEE transaction on neural networks (S1045- 9227), 2005, 10 (3) :645-678.
2Mac Queen J. Some methods for classification and analysis of multivariate observations [C] // LeCam L M, Neyman J, eds.Proceedings of 5-th Berkeley Symposium on Mathematical Sta- tistics and Probabilit. Berkeley: University of California Press, 1967:281-297.
3Kim T,Bezbek J C. Optimal tests for the fixed points of the fuzzy C-means algorithms [J]. Pattern Recognition (S0031- 3203), 1988,31 : 651-663.
4Guha S, Rastogi R, Shim K. CURE:An efficient clustering algo- rithm for large databases [C]//Proc. ACM SIGMOD Int. Conf. Management of Data. Seattle, Washington: ACM Press, 1998: 73-84.
5Kaufmann L,Rousseeuw P J. Finding Groups in Data: An Intro- duction to Cluster Analysis [M]. New York: Lohn Wiley & Sons, 1990: 67-89.
6Guha S, Rastogi R, Shim K. ROCK: A robust clustering algo- rithm for categorical attributes [J]. Informatic Systems (S1746- 0980) ,2000,25(5) :345-366.
7Karypis G, Han E, Kumar V. Chameleon:Hierarchical cluster in gusing dynamic modeling [J]. IEEE Computer (S0018-9162), 1999,32(8):68-75.
8Zhang T, Ramakrishnan R, Livny M. BIRCH: An efficient data clustering method for very large databases [C]//Proc. of the 15^th ACM SIGMOD Int'l Conf. on Management of Data. Mon- trel: ACM Press, 1996 : 103-114.
9Ester M, Kriegel H P, Sander J, et al. A density- based algorithm for discovering clusters in large spatial databases with noise [C]// Simoudis E, Han J W, Fayyad U, eds. Proc of the 2nd Int'l Conf on Knowledge Discovery and Data Mining, KDD96. Menlo Park: AAAI Press, 1996 : 226-231.
10Ankerst M, Breuing M, Kriegel H P, et al. OPTICS: Ordering points to identify the clustering structure [C] // Delis A, Falout- sos C, Ghandeharizadeh S, eds. Proc of the 1999 ACM SIGMOD Int'l Conf on Management of Data, 1999 ACM SIGMOD. New York: ACM Press, 1999 : 46-60.

二级参考文献22

1淦文燕,李德毅,王建民.一种基于数据场的层次聚类方法[J].电子学报,2006,34(2):258-262. 被引量：84
2王珏,苗夺谦,周育健.关于Rough Set理论与应用的综述[J].模式识别与人工智能,1996,9(4):337-344. 被引量：264
3FAHIM A.M,SALEM A.M,TORKEY F.A,RAMADAN M.A.An efficient enhanced k-means clustering algorithm[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2006,7(10):1626-1633. 被引量：30
4Pawlak Z. Rough sets. International Journal of Information and Computer Sciences, 1982,11 : 145-172
5Lingras P, West C. Interval set clustering of web users with rou - gh k-means. Journal of Intelligent Information Systems, 2004,23 (1):5-1643
6Wang Ruizhi, Miao Duoqian, Li Gang, et al. Rough Overlapping Biclustering of Gene Expression Data//Proceedings of the 7th IEEE International Conference on Bioinformatics and Bioengi- neering. 2007:828-834
7Peters G. Some refinements of rough k-means clustering. Pattern Recognition, 2006,39 (8) : 1481-1491
8Mitra S. An evolutionary rough partitive clustering. Pattern Recognition Letters, 2004,25 (12) : 1429-1449
9Peters G, Lampart M. A Partitive Rough Clustering Algorithm. Rough Sets and Current Trends in Computing,2006,4259(1):658
10Davies D, Bouldin D. A Cluster Separation Measure. IEEE Trans, Pattern Anal, 1979,1 (2) : 224-227

共引文献36

1上官廷华,冯荣耀,柳宏川.一种基于熵和均方差法综合赋权的K-means算法[J].计算机与现代化,2010(4):34-36. 被引量：11
2谢娟英,张琰,谢维信,高新波.一种新的密度加权粗糙K-均值聚类算法[J].山东大学学报（理学版）,2010,45(7):1-6. 被引量：12
3洪亮亮,罗可.改进的基于遗传算法的粗糙聚类方法[J].计算机工程与应用,2010,46(25):142-145. 被引量：10
4周涛.具有自适应参数的粗糙k-means聚类算法[J].计算机工程与应用,2010,46(26):7-10. 被引量：8
5周杨.初始化中心点优化的K-means算法[J].科技信息,2011(4):106-106. 被引量：2
6王丹,吴孟达.动态阈值粗糙C均值算法[J].计算机科学,2011,38(3):218-221. 被引量：1
7钟诚.基于粗糙集的聚类方法研究[J].琼州学院学报,2011,18(2):8-10. 被引量：3
8张军,黄顺亮.动态粗集理论在K-均值聚类中的应用[J].计算机工程与应用,2011,47(26):25-26. 被引量：1
9姚强,张研,张士靖.双向聚类在文献计量学中的应用初探——以医院绩效评价为例[J].情报杂志,2012,31(3):54-59. 被引量：30
10任丽娜,秦永彬,许道云.基于自适应权重的模糊C-均值聚类算法[J].计算机应用研究,2012,29(8):2849-2851. 被引量：8

同被引文献97

1肖峻,罗凤章,王成山,李毅.区间层次分析法权重计算中的概率分布分析[J].天津大学学报（自然科学与工程技术版）,2005,38(3):189-194. 被引量：8
2何明,冯博琴,马兆丰,傅向华.基于熵和信息粒度的粗糙集聚类算法[J].西安交通大学学报,2005,39(4):343-346. 被引量：6
3赵宇,李兵,李秀,刘文煌,任守榘.混合属性数据聚类融合算法[J].清华大学学报（自然科学版）,2006,46(10):1673-1676. 被引量：9
4孙天晴.基于结构分解分析法的L-P指数均值分解法的实证研究[J].商场现代化,2007(06Z):22-23. 被引量：4
5HAN Jia-wei,KAMBER M.数据挖掘:概念与技术[M].北京:机械工业出版社,2007.
6杨春宇,周杰.一种混合属性数据流聚类算法[J].计算机学报,2007,30(8):1364-1371. 被引量：22
7关心,王新.基于k-means改进算法的入侵检测系统的研究[J].计算机系统应用,2007,16(9):82-84. 被引量：2
8谭 P N,斯坦巴赫 M,库玛 V.数据挖掘导论[M].范明,范宏建,译.北京:人民邮电大学出版社,2006:59-62.
9邓纳姆 M H.数据挖掘教程[M].郭崇慧,田凤占,靳晓明,等译.北京:清华大学出版社,2005:5-8.
10高新波.模糊聚类分析及其应用[M].西安:西安电子科技大学出版社,2003.

引证文献12

1赵根柱,巴特尔,王钢.基于均值汇总模型的网络流量评估方法的研究[J].广西大学学报（自然科学版）,2011,36(A01):27-30.
2任丽娜,秦永彬,许道云.基于自适应权重的模糊C-均值聚类算法[J].计算机应用研究,2012,29(8):2849-2851. 被引量：8
3王学恩,韩德强,韩崇昭.采用不确定性度量的粗糙模糊C均值聚类参数获取方法[J].西安交通大学学报,2013,47(6):55-60. 被引量：9
4李莲,罗可,周博翔.基于粒计算的粗糙集聚类算法[J].计算机应用研究,2013,30(10):2916-2919. 被引量：9
5刘强,邓磊,贾振红,覃锡忠.一种改进的加权K-prototypes算法[J].激光杂志,2014,35(1):18-20. 被引量：5
6王法云,何振峰.加权闵可夫斯基K-Means的指数选取策略[J].计算机系统应用,2015,24(2):151-154. 被引量：4
7王全蕊,王建平.基于属性依赖关系和对象相关性的自然聚类算法[J].小型微型计算机系统,2015,36(4):810-814. 被引量：1
8马福民,逯瑞强,张腾飞.基于边界区域局部模糊增强的πRKM聚类算法[J].控制与决策,2017,32(11):1949-1956. 被引量：4
9刘洋,王慧琴,张小红.结合蚁群算法的改进粗糙K均值聚类算法[J].数据采集与处理,2019,34(2):341-348. 被引量：16
10曾强,俞立平.科技评价指标权重分类及对评价的影响研究[J].现代情报,2021,41(6):139-148. 被引量：5

二级引证文献74

1刘华英,汤英,侯宗英.创伤急救术中的护理道德[J].黑龙江护理杂志,2000,6(5):27-28.
2姚茂宣,任丽娜.基于自适应权重模糊C-均值聚类的瓦斯突出预测[J].煤炭工程,2012,44(10):96-99. 被引量：2
3王思翠.基于S2AFCM的子主题划分[J].计算机与网络,2013,39(11):61-63.
4李会民,闫健卓,方丽英,王普.基于Eros距离的纵向数据模糊聚类方法[J].北京工业大学学报,2013,39(8):1161-1165. 被引量：1
5杨正理.模糊C-均值聚类算法在动态汽车衡中的应用[J].自动化仪表,2013,34(9):73-77. 被引量：9
6肖满生,肖哲,文志强,于惠钧.模糊C均值聚类区间型模糊化参数模型[J].系统工程与电子技术,2015,37(4):868-873. 被引量：15
7欧阳浩,王智文,戴喜生,刘智琦.基于信息增益的模糊K-prototypes聚类算法[J].计算机工程与科学,2015,37(5):1009-1014.
8蒙祖强,胡玉兰,蒋亮,常红岩.基于混合蛙跳与阴影集优化的粗糙模糊聚类算法[J].控制与决策,2015,30(10):1766-1772. 被引量：8
9卞彩峰,邱建林,陈燕云,陆鹏程,陈璐璐.基于粒计算的k值选取及其应用[J].计算机工程与设计,2015,36(11):3082-3086. 被引量：4
10严旭,王青海.基于变精度粗糙集改进K-means聚类算法[J].办公自动化,2017,22(8):18-21.

1胡云,苗夺谦,王睿智,陈敏.一种基于粗糙k均值的双聚类算法[J].计算机科学,2007,34(11):174-177. 被引量：8
2吴宏杰,吕强,叶红霞,胡伏原,付保川,钱培德.一种基于粗糙K均值的多靶点中心优化方法[J].苏州科技学院学报（工程技术版）,2012,25(3):76-80.
3曾三友,蔡振华,张青,康立山.一种评估近似Pareto前沿多样性的方法[J].软件学报,2008,19(6):1301-1308. 被引量：8
4汪亚顺,徐铭政.基于二维工程图的数字水印比例算法[J].南昌大学学报（工科版）,2003,25(4):29-31. 被引量：17
5李骥,莫小锋,王威,杨蔚蔚.一种基于雾天图像增强的SURF图像匹配方法[J].计算机工程与应用,2015,51(14):141-145. 被引量：2
6刘家星,朱国魂,席敏.一种基于半径的k-means算法[J].桂林电子科技大学学报,2013,33(2):134-138. 被引量：1
7邹维丽,陈红梅,胡成祥,李天瑞.集值粗糙集模型的近似集增量更新方法研究[J].广西师范大学学报（自然科学版）,2009,27(3):93-96. 被引量：4
8石陆魁,张军,宫晓腾.基于邻域保持的流形学习算法评价模型[J].计算机应用,2012,32(9):2516-2519. 被引量：2
9任丽娜,秦永彬,许道云.基于自适应权重的模糊C-均值聚类算法[J].计算机应用研究,2012,29(8):2849-2851. 被引量：8
10张辉.容差关系下集值信息系统多粒度粗糙集[J].计算机工程与设计,2014,35(2):661-665. 被引量：1

计算机科学

2011年第6期

浏览历史

内容加载中请稍等...

基于自适应权重的粗糙K均值聚类算法被引量：12

参考文献20

二级参考文献22

共引文献36

同被引文献97

引证文献12

二级引证文献74

相关作者

相关机构

相关主题

浏览历史

基于自适应权重的粗糙K均值聚类算法 被引量：12

参考文献20

二级参考文献22

共引文献36

同被引文献97

引证文献12

二级引证文献74

相关作者

相关机构

相关主题

浏览历史

基于自适应权重的粗糙K均值聚类算法被引量：12