一种改进节点凝聚度的密度峰值聚类算法被引量：5

Density Peak Clustering Algorithm for Improved Node Aggregation

下载PDF

导出

摘要针对密度峰值聚类算法(Density Peak Clustering,DPC)在密度分布不均匀及同一个簇有多个高密度点的数据集中难以准确选取聚类中心的情况,提出一种改进节点凝聚度的密度峰值聚类算法.先将数据转化为一个加权的完全图.其次,引入改进后的节点凝聚度的思想构建节点重要度的评价函数,并计算网络中每个节点的局部重要度,聚类中心为局部重要度最高的节点并且与重要度大于该聚类中心重要度的点具有较大距离.然后,对节点重要度进行排序,比较选取节点重要度与距离乘积值异常大的点作为类簇中心.最后,利用所提出的算法和其他密度峰值聚类算法比较,在人工数据集和真实数据集上的实验仿真表明,该算法能够找到具有更高精度的聚类中心,从而可以实现更高的性能. Aiming at density peak clustering algorithm(DPC),it is difficult to accurately select cluster centres in uneven density distribution datasets or multiple high-density points in the same cluster.It proposed a density peak clustering algorithm on improved node aggregation.Firstly,a dataset to be classified was converted into a weighted complete graph.Secondly,the enhanced aggregation method was constructed as an evaluation function of node importance and calculated the local significance of each node in the network.The cluster centre had a higher value of local importance than surrounding neighbour nodes.And the node,which is compared with other height-importance nodes,had more considerable distance.Then,we could sort node importance and select an extremely value that node importance producting node distance as a cluster centre in the same cluster.Finally,experimental simulations with the proposed algorithm and a few existing DPC based algorithms on both artificial and real datasets show ed that the proposed algorithm can find cluster centres with higher accuracy and thus can achieve improved performance.

作者吴辰文魏立鑫刘晓光 WU Chen-wen;WEI Li-xin;LIU Xiao-guang(School of Electronic and Information Engineering,Lanzhou Jiaotong University,Lanzhou 730070,China;Department of Computer Application,School of Electronic and Information Engineering,Lanzhou Jiaotong University,Lanzhou 730070,China;Department of Software Engineering,School of Electronic and Information Engineering,Lanzhou Jiaotong University,Lanzhou 730070,China)

机构地区兰州交通大学电子与信息工程学院

出处《小型微型计算机系统》 CSCD 北大核心 2020年第7期1427-1432,共6页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61762057,61662043)资助。

关键词加权完全图关键词凝聚度节点收缩 weighted complete graph aggregation node contraction density peak clustering

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献10

1许朝阳,林耀海,张萍.基于密度二分法的密度峰值聚类方法[J].计算机工程与应用,2018,54(12):138-145. 被引量：4
2朱涛,张水平,郭戎潇,常国岑.改进的加权复杂网络节点重要度评估的收缩方法[J].系统工程与电子技术,2009,31(8):1902-1905. 被引量：81
3谭跃进,吴俊,邓宏钟.复杂网络中节点重要度评估的节点收缩方法[J].系统工程理论与实践,2006,26(11):79-83. 被引量：267
4杨黎刚,苏宏业,张英,褚健.基于SOM聚类的数据挖掘方法及其应用研究[J].计算机工程与科学,2007,29(8):133-136. 被引量：32
5张健沛,杨悦,杨静,张泽宝.基于最优划分的K-Means初始聚类中心选取算法[J].系统仿真学报,2009,21(9):2586-2590. 被引量：62
6田柳,狄增如,姚虹.权重分布对加权网络效率的影响[J].物理学报,2011,60(2):797-802. 被引量：48
7王甲生,吴晓平,廖巍,陈永强.改进的加权复杂网络节点重要度评估方法[J].计算机工程,2012,38(10):74-76. 被引量：45
8高诗莹,周晓锋,李帅.基于密度比例的密度峰值聚类算法[J].计算机工程与应用,2017,53(16):10-17. 被引量：22
9盛华,张桂珠.一种融合K-means和快速密度峰值搜索算法的聚类方法[J].计算机应用与软件,2016,33(10):260-264. 被引量：14
10WANG Shuliang,WANG Dakui,LI Caoyuan,LI Yan,DING Gangyi.Clustering by Fast Search and Find of Density Peaks with Data Field[J].Chinese Journal of Electronics,2016,25(3):397-402. 被引量：64

二级参考文献92

1於跃成,刘彩生,生佳根.分布式约束一致高斯混合模型[J].南京理工大学学报,2013,37(6):799-806. 被引量：3
2严网,周涛,王杰,傅忠谦,汪秉宏.Epidemic Spread in Weighted Scale-Free Networks[J].Chinese Physics Letters,2005,22(2):510-513. 被引量：20
3王汉芝,刘振全.一种新的确定K-均值算法初始聚类中心的方法[J].天津科技大学学报,2005,20(4):76-79. 被引量：9
4张文君,顾行发,陈良富,余涛,许华.基于均值-标准差的K均值初始聚类中心选取算法[J].遥感学报,2006,10(5):715-721. 被引量：60
5FAHIM A.M,SALEM A.M,TORKEY F.A,RAMADAN M.A.An efficient enhanced k-means clustering algorithm[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2006,7(10):1626-1633. 被引量：30
6王林,张婧婧.复杂网络的中心化[J].复杂系统与复杂性科学,2006,3(1):13-20. 被引量：61
7谭跃进,吴俊,邓宏钟.复杂网络中节点重要度评估的节点收缩方法[J].系统工程理论与实践,2006,26(11):79-83. 被引量：267
8牛琨,张舒博,陈俊亮.融合网格密度的聚类中心初始化方案[J].北京邮电大学学报,2007,30(2):6-10. 被引量：16
9袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：157
10A H Pilevar, M Sukumar. GCHL: A grid-clustering algorithm for high- dimensional very large spatial data bases [J]. Pattern Recognition Letters (S0167-8655), 2005, 26(7): 999-1010.

共引文献543

1陆小莉,刘强,徐生霞.中国产业转型升级的空间分异与影响机制研究[J].经济问题探索,2021(2):135-144. 被引量：7
2金伟超,韩畅,杨莉,林振智,高强,应国德.计及多阶段抗灾性能的骨干网架多目标优化[J].电力系统自动化,2020(15):52-69. 被引量：10
3陶俐言,王帅.提高加权供应链网络鲁棒性的问题[J].系统工程,2020,38(1):66-74. 被引量：8
4刘浪,邓伟,采峰,陈玲.节点重要度计算的新方法——优先等级法[J].中国管理科学,2007,15(Z1):162-165.
5齐小刚,张成才,刘立芳.WSN节点重要性和网络抗毁性的分析方法[J].系统工程理论与实践,2011,31(S2):33-37. 被引量：4
6丁长虹,董兴文,桂马立.用熵权法估计地域通信网络节点[J].电脑编程技巧与维护,2009(S1):117-119. 被引量：2
7高飞,鱼江,任芳,黄保瑞,次旺多吉.四维文档向量模型的k-means新闻文本聚类算法[J].西藏大学学报（社会科学版）,2013,28(4):109-112.
8侯本伟,杜修力,王威.基于用户综合重要度的城市供水管网抗震性能化设计[J].土木工程学报,2015,48(5):11-22. 被引量：5
9陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
10赵晓丹,齐志.基于SOM神经网络的聚类方法研究[J].吉林省经济管理干部学院学报,2008,22(2):81-83. 被引量：4

同被引文献44

1杨燕,靳蕃,KAMEL Mohamed.聚类有效性评价综述[J].计算机应用研究,2008,25(6):1630-1632. 被引量：117
2许朝阳,林耀海,张萍.基于密度二分法的密度峰值聚类方法[J].计算机工程与应用,2018,54(12):138-145. 被引量：4
3高诗莹,周晓锋,李帅.基于密度比例的密度峰值聚类算法[J].计算机工程与应用,2017,53(16):10-17. 被引量：22
4朱庆峰,葛洪伟.K近邻相似度优化的密度峰聚类[J].计算机工程与应用,2019,55(2):148-153. 被引量：8
5纪霞,张涛,朱建磊,刘诗诚,李学俊.近邻密度分布优化样本分配的改进DPC聚类算法[J].华南理工大学学报（自然科学版）,2019,47(2):98-105. 被引量：3
6刘立,赵建军,余进,张锦鹏.一种面向车辆位置信息的异构数据实时云存储及可视化[J].昆明理工大学学报（自然科学版）,2019,44(3):52-57. 被引量：2
7高月,杨小飞,马盈仓,汪义瑞.基于共享k-近邻与共享逆近邻的密度峰聚类[J].计算机工程与应用,2019,55(20):43-51. 被引量：5
8李艳虹,寇纲,彭怡,李光旭.基于矩阵相似性的异构群体偏好信息集结方法[J].系统科学与数学,2019,39(10):1672-1683. 被引量：5
9陈春涛,陈优广.基于影响空间的稳健密度峰值聚类算法[J].计算机科学,2019,46(11):216-221. 被引量：1
10王军华,李建军,李俊山,赖文达.自适应快速搜索密度峰值聚类算法[J].计算机工程与应用,2019,55(24):122-127. 被引量：11

引证文献5

1陈金山.基于密度峰值的电子商务用户行为数据聚类方法[J].哈尔滨师范大学自然科学学报,2023,39(4):65-69.
2王芙银,张德生,肖燕婷.基于加权共享近邻与累加序列的密度峰值算法[J].计算机工程,2022,48(4):61-69. 被引量：6
3李沛武,张永芳,黄逸翠,刘紫亮,居翔.基于双重密度和簇间近邻度的密度峰值聚类算法[J].南昌工程学院学报,2022,41(4):29-36. 被引量：3
4张新元,贠卫国.共享K近邻和多分配策略的密度峰值聚类算法[J].小型微型计算机系统,2023,44(1):75-82. 被引量：7
5李征.半监督全局异构信息保存的网络表示学习[J].计算机应用与软件,2023,40(6):257-265.

二级引证文献15

1王炫,王世杰,刘扬,李欣,致远.基于风险点算法的电网业务风险智能预测方法[J].自动化与仪器仪表,2023(7):118-121. 被引量：1
2周浩岩,叶军,谢立,卢岚,李兆彬.基于果蝇算法优化的粗糙C均值聚类算法[J].南昌工程学院学报,2023,42(4):79-86. 被引量：2
3徐童童,解滨,张喜梅,张春昊.自适应聚类中心策略优化的密度峰值聚类算法[J].计算机工程与应用,2023,59(21):91-101. 被引量：5
4李福祥,周明,杨天浩.基于共享邻域的密度峰值聚类算法[J].哈尔滨理工大学学报,2023,28(4):42-52. 被引量：1
5朱鸿祥,吴根秀,王兆辉.基于共享邻近度和概率分配的密度峰值聚类算法[J].计算机工程与应用,2024,60(12):74-90. 被引量：3
6孙林,梁娜,徐久成.基于邻域互信息与K-means特征聚类的特征选择[J].智能系统学报,2024,19(4):983-996. 被引量：4
7王心耕,杜韬,周劲,陈迪,仵匀政.基于共享最近邻的自适应密度峰值聚类算法[J].计算机科学,2024,51(8):97-105. 被引量：2
8衡欣,焦禹淦,郑延斌.改进旋转平衡森林的数据密度峰值聚类算法[J].计算机仿真,2024,41(8):338-343.
9范强,吕莉,邱日轩,崔希,张宸源,樊棠怀.反距离加权和微簇合并的密度峰值聚类算法[J].南昌工程学院学报,2024,43(6):43-50. 被引量：1
10谢敏,周毅超,曾斌,罗莹,王鹏,王文丰.基于改进密度峰值聚类的河湖巡查定界算法[J].江西科学,2025,43(1):10-17.

1杨旭华,朱钦鹏,童长飞.基于Laplacian中心性的密度聚类算法[J].计算机科学,2018,45(1):292-296. 被引量：2
2陶俐言,王帅.提高加权供应链网络鲁棒性的问题[J].系统工程,2020,38(1):66-74. 被引量：8
3崔园.基于描峰聚类的动态脑功能网络状态划分[J].北京生物医学工程,2019,38(6):575-582.
4惠宁,伍杰,周一青,刘玲,潘振岗.未来车辆雾计算网络[J].电信科学,2020,36(6):14-27. 被引量：4
5冯小芸,朱俊杰,朱菲,王国平.一类图的零化度[J].伊犁师范学院学报（自然科学版）,2020,14(1):8-13.
6刘军辉,梁国栋.基于收缩平衡的精密注塑产品翘曲优化方法[J].塑料,2020,49(3):62-65. 被引量：10
7王朝阳,赵海兴,张科,谢笋.完全多部图全终端可靠度的一种计算方法[J].电子设计工程,2020,28(14):1-5.
8刘影,吴常坤,谈丽娟.基于模糊控制的电梯群控调度算法设计与研究[J].自动化与仪表,2020,35(7):35-40. 被引量：5
9郝思嘉,陆红刚,王晓涵.基于图像处理的自动调焦技术研究[J].电子元器件与信息技术,2020,4(4):120-121. 被引量：4
10郑佳华,张峰,赵天启,赵萌莉.放牧和刈割对大针茅草原羊草空间异质性的影响[J].西北农林科技大学学报（自然科学版）,2020,48(6):10-17. 被引量：6

小型微型计算机系统

2020年第7期

浏览历史

内容加载中请稍等...

一种改进节点凝聚度的密度峰值聚类算法被引量：5

参考文献10

二级参考文献92

共引文献543

同被引文献44

引证文献5

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

一种改进节点凝聚度的密度峰值聚类算法 被引量：5

参考文献10

二级参考文献92

共引文献543

同被引文献44

引证文献5

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

一种改进节点凝聚度的密度峰值聚类算法被引量：5