基于结构相似性和压缩变换的聚类方法被引量：5

Clustering Method Based on Structural Similarity and Compressive Transformation

导出

摘要针对聚类分析在处理任意形状、任意密度和具有一定结构特征的数据集时存在的不足,首先在数据空间中建立离散拓扑流形,通过在此结构上定义邻域密度相似性和邻域密度变化光滑性两个相对性度量标准,并利用可达性给出样本结构相似性和类结构的定义,证明类结构关系是一个等价关系.然后将结构相似性当作吸引力,设计基于压缩变换的聚类方法,该方法具备处理任意形状、任意密度和解释性好等许多优点.最后在人工数据集和标准数据集上的比较实验结果表明,该方法在聚类效率和有效性上都明显优于其它聚类算法. The current clustering methods are difficult to handle the complicated problems in which shapes and densities are changing along with the data. To overcome the shortcomings of existing clustering methods, based on discrete topological manifold created in the data space, the structural similarity of samples and the class structure are described by accessibility after defining two new relativity metrics： the neighborhood density similarity and the smoothness of neighborhood density changes. The class structure relationship is proved to an equivalence relation. Then, a clustering algorithm is designed based on compressive transformation by treating the structural similarity defined on samples as the attractiveness. The algorithm is designed to handle data with any shapes and any density, maintaining good interpretability and many other advantages. Experimental result on the artificial data sets and standarddata sets shows that the method is superior to the state-of-the-art methods.

作者牟廉明詹德川黎铭周志华

机构地区内江师范学院四川省高等学校数值仿真重点实验室南京大学计算机软件新技术国家重点实验室

出处《模式识别与人工智能》 EI CSCD 北大核心 2011年第5期637-644,共8页 Pattern Recognition and Artificial Intelligence

基金国家自然科学基金(No.60903103 10872085) 四川省科技厅应用基础研究基金(No.07JY029-125)资助项目

关键词聚类分析离散拓扑流形结构相似性类结构压缩变换 Cluster Analysis, Discrete Topological Manifold, Structural Similarity, Class Structure,Compressive Transformation

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献15

1~ichard O, Duda P E, Hart D G S. Pattern Classification. 2nd Edi- ion. New York, USA: John Wiley & Sons, 2001.
2Theodoridis S, Koutroumbas K. Pattern Recognition. 2nd Edition. Amsterdam, Netherlands: Elsevier, 2003.
3Zhang Tian, Ramakrishnan R, Livny M. BIRCH : An Efficient Data Clustering Method for Very Large Databases // Proc of the ACM SIGMOD International Conference on Management of Data. Montre- al, Canada, 1996: 103- 114.
4Ester M, Kriegel H P, Sander J, et al. A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise /// Proc of the ACM SIGKDD International Conference on Management of Data. Montreal, Canada, 1996:226 - 231.
5Wang Wei, Yang Jiong, Muntz R. STING: A Statistical Information Grid Approach to Spatial Data Mining// Proc of the 23rd Intema-tional Conference on Very Large Databases. Athens, Greece, 1997: 186 - 196.
6Xu Linli, Neufeld J, Larson B, et al. Maximum Margin Clustering //Saul L K, Weiss Y, Bottou L, eds. Advances in Neural Informa- tion Processing Systems. Cambridge, USA: MIT Press, 2005, XVII, 1537 - 1544.
7Chan P M, Schlag M D F, Zien J Y. Spectral k-Way Ratio-Cut Par- titioning and Clustering // Proc of the 30th International Design Automation Conference. Dallas, USA, 1993 : 749 - 754.
8Frey B J, Dueck D. Clustering by Passing Messages between Data Points. Science, 2007, 315(5814): 972-976.
9Shuai Dianxun, Dong Yumin, Shuai Qiug. A New Data Clustering Approach: Generalized Cellular Automata. Information Systems, 2007, 32(7): 968-977.
10Zhang Chaolin, Zhang Xuegong, Zhang M Q, et al. NeighborNumber, Valley Seeking and Clustering. Pattern Recognition Let- ters, 2007, 28(2) : 173 -180.

同被引文献66

1杨善林,李永森,胡笑旋,潘若愚.K-MEANS算法中的K值优化问题研究[J].系统工程理论与实践,2006,26(2):97-101. 被引量：197
2梁昌勇,吴坚,陆文星,丁勇.一种新的混合型多属性决策方法及在供应商选择中的应用[J].中国管理科学,2006,14(6):71-76. 被引量：41
3袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：157
4Frey B J,Dueck D. Clustering by passing messages between data points[J]. Science, 2007,315 (5814) : 972-976.
5Pollard D. Strong consistency of Kmeans clustering[J]. Ailnals of Statistics, 1981,9 (1) : 135-140.
6Zhang T, Ramakrishnan R, Livny M. BIRCH. An efficient data clustering method for very large databases[J]. Montreal, 1996,6 (96) :103-114.
7Pat N R, Bezdek J C. On cluster validity for the fuzzy c-means model[J]. IEEE Transactions on Fuzzy Systems, 1995, 3 (3): 370-379.
8Tsang I W,Kwok J T,Cheung P M. Core vector machines: fast SVM training on very large data sets[J]. Journal of Machine Learning Research, 2005,8(6) : 363-392.
9Deng Zhao-hong, Choi K S, Chung F L, et al. Enhanced soft sub- space clustering integrating within cluster and between bluster- Information[J]. Pattern Recognition, 2010,43 (3) : 767-781.
10Liu Jun,Mohammed J, Carter J, et al. Distance based clustering of CGH data[J]. Bioinformaties, 2006,22(16) : 1971 -1978.

引证文献5

1甘月松,陈秀宏,陈晓晖.一种AP算法的改进:M-AP聚类算法[J].计算机科学,2015,42(1):232-235. 被引量：17
2冷亚军,陆青,梁昌勇.基于结构相似性的协同过滤推荐算法[J].小型微型计算机系统,2015,36(10):2266-2269. 被引量：8
3赵延龙,滑楠.基于初始偏向度的AP算法聚类性能优化研究[J].计算机应用研究,2018,35(2):372-374. 被引量：2
4肖居承,何光宇,张思远,王治华,常乃超,卢强.事故备用分散转移的效益评估[J].电力系统自动化,2020,44(13):9-16. 被引量：4
5冷亚军,吴宗育,赵文会,黎忠雪.基于近邻传播聚类权重的黑启动方案评估方法[J].电力系统自动化,2020,44(13):73-80. 被引量：16

二级引证文献46

1顾唐杰,秦波,蒋小菲.一种基于改进型Chameleon算法的宿舍分配方法[J].智能计算机与应用,2022,12(5):23-30. 被引量：2
2党宏社,白梅.一种基于分层AP的视频关键帧提取方法研究[J].陕西科技大学学报（自然科学版）,2016,34(1):159-163.
3赵华,章成志.中英文突发事件话题演化对比研究--以H7N9微博为例[J].情报资料工作,2016,37(3):19-27. 被引量：4
4赵华,章成志.利用作者主题模型进行图书馆UGC的主题发现与演化研究[J].图书馆论坛,2016,36(7):34-45. 被引量：7
5郑洁,钱育蓉,杨兴耀,黄兰,马婉贞.基于信任和项目偏好的协调过滤算法[J].计算机应用,2016,36(10):2784-2788. 被引量：15
6曾安,谢杰民,潘丹.基于项目候选集的协同过滤算法[J].计算机应用研究,2016,33(12):3620-3624. 被引量：1
7王华秋,殷志恒.采用自适应聚类的教学视频关键帧研究[J].计算机时代,2016(12):90-94.
8董立岩,王越群,贺嘉楠,孙铭会,李永丽.基于时间衰减的协同过滤推荐算法[J].吉林大学学报（工学版）,2017,47(4):1268-1272. 被引量：32
9覃华,詹娟娟,苏一丹.基于概率无向图模型的近邻传播聚类算法[J].控制与决策,2017,32(10):1796-1802. 被引量：9
10赵宏业.基于协同过滤算法的医院人力资源信息智能采集系统设计[J].电子设计工程,2017,25(21):34-37. 被引量：5

1宋玉莉.基于分形压缩变换的数字水印技术[J].消费导刊,2009,0(11):181-181.
2颜普,梁栋,朱明,唐俊.基于非抽样Contourlet域的局部特征描述子[J].四川大学学报（工程科学版）,2015,47(1):150-155.
3李谦.基于小波变换和纹理特征的水印算法的研究[J].计算机工程与设计,2006,27(14):2616-2619. 被引量：6
4曾剑芬,马争鸣.迭代图像编码[J].数据采集与处理,2001,16(z1):244-248.
5唐耀红,魏慧琴.基于垂直压缩格式的高效FP-STREAM算法的研究[J].计算机科学,2012,39(10):160-163.
6王绍卿,李业德.一种二维波形无失真压缩变换的实现方法[J].山东理工大学学报（自然科学版）,2004,18(6):80-83.
7梁艺宝.利用平面点的压缩变换绘制随机分形树叶的Matlab算法[J].计算机光盘软件与应用,2013(1):29-30.
8谭丽,孙季丰.基于码书索引变换的高通量DNA序列数据压缩算法[J].电子学报,2015,43(5):1007-1013. 被引量：1
9董振华,李喜艳.基于SVD和EMD-S编码的隐藏算法[J].微型机与应用,2016,35(18):42-44. 被引量：1
10李文敬,钟智,元昌安.基于GEP的分形图像压缩并行算法[J].计算机工程,2012,38(7):201-202. 被引量：2

模式识别与人工智能

2011年第5期

浏览历史

内容加载中请稍等...

基于结构相似性和压缩变换的聚类方法被引量：5

参考文献15

同被引文献66

引证文献5

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

基于结构相似性和压缩变换的聚类方法 被引量：5

参考文献15

同被引文献66

引证文献5

二级引证文献46

相关作者

相关机构

相关主题

浏览历史

基于结构相似性和压缩变换的聚类方法被引量：5