K均值聚类算法初始质心选择的改进被引量：15

K Mean Cluster Algorithm with Refined Initial Center Point

下载PDF

导出

摘要聚类分析在信息检索和数据挖掘等领域都有很广泛的应用,K均值聚类算法是一个比较简洁和快速的聚类算法,但是它存在着初始聚类个数必须事先设定以及初始质心的选择也具有随机性等缺陷,造成聚类的结果不是最优的。针对K均值聚类算法中的随机指定初始质心的缺点,提出了基于密度和最近邻相似度的初始质心选择算法,实验显示该算法可以生成质量较高而且较稳定的聚类结果,但是改进的算法需要事先设定最近邻相似度的阈值计算量较大等缺点,还有待改进。 Cluster analysis have very extensive application in information retrieval and data mining, in which K mean algorithm is a more succinct and more fast cluster algorithm, but it has one counts in the initial cluster to need establishing in advance, and the choice of the initial centroid has randomness too, this lead to the fact that the result of the cluster is not optimum. To the shortcoming of appointing the initial center at random in cluster＇s algorithm of K mean, the authors choose the algorithm after putting forward the Shared Nearest Neighbor similar degree on the basis of the density. Experiment reveals this algorithm can produce higher and more steady cluster＇ s result of quality. But the improved algorithm needs to establish greater Shared Nearest Neighbor similar degree in advance, so the algorithm still remain to improve.

作者孙可刘杰王学颖

机构地区沈阳师范大学科信软件学院沈阳师范大学学报编辑部

出处《沈阳师范大学学报（自然科学版）》 CAS 2009年第4期448-450,共3页 Journal of Shenyang Normal University:Natural Science Edition

基金国家自然科学基金资助项目(60970112)

关键词聚类 K均值聚类算法初始质心密度最近邻相似度 clustering K-means clustering algorithm initial center point Density SNN（Shared Nearest Neighbor）similar degree

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献9

1朱颢东,钟勇,赵向辉.一种优化初始中心点的K-Means文本聚类算法[J].郑州大学学报（理学版）,2009,41(2):29-32. 被引量：13
2汪中,刘贵全,陈恩红.一种优化初始中心点的K-means算法[J].模式识别与人工智能,2009,22(2):299-304. 被引量：145
3徐向阳.K-均值聚类算法在关系数据库中的应用[J].桂林电子科技大学学报,2008,28(4):313-316. 被引量：3
4刘艳丽,刘希玉,孟岩,祖伟.K-均值算法聚类分析及其在人力资源管理中的应用[J].山东科学,2008,21(2):33-38. 被引量：5
5匡青,鲍梦.改进蚁群算法的动态K-均值聚类分析[J].教育技术导刊,2008(1):154-155. 被引量：7
6查成东,王长松,巩宪锋,周家新.基于改进K-均值聚类算法的背景提取方法[J].计算机工程与设计,2007,28(21):5141-5143. 被引量：7
7刘韬,蔡淑琴,曹丰文,崔志磊.基于距离浓度的K-均值聚类算法[J].华中科技大学学报（自然科学版）,2007,35(10):50-52. 被引量：7
8刘罗曼,张颖南.因子分析和聚类分析的一个简单应用[J].沈阳师范大学学报（自然科学版）,2005,23(2):130-132. 被引量：8
9()MargaretH.Dunham著,郭崇慧,田凤占,靳晓明等.数据挖掘教程[M]清华大学出版社,2005.

二级参考文献50

1张白妮,骆嘉伟,汤德佑.动态的K-均值聚类算法在图像检索中的应用[J].计算机工程与设计,2004,25(10):1843-1846. 被引量：12
2刘韬,王耀才,王致杰.一种基于人工免疫系统的聚类算法[J].计算机工程与设计,2004,25(11):2051-2053. 被引量：14
3吕强,俞金寿.基于混合遗传算法的K-Means最优聚类算法[J].华东理工大学学报（自然科学版）,2005,31(2):219-222. 被引量：8
4LIUTao,WANGYao-cai,WANGZhi-jie,MENGJiang.Distance Concentration-Based Artificial Immune Algorithm[J].Journal of China University of Mining and Technology,2005,15(2):81-85. 被引量：6
5吕常魁,姜澄宇,王宁生.一种新的运动检测及轮廓追踪方法[J].武汉大学学报（信息科学版）,2005,30(8):723-727. 被引量：11
6倪巍伟,陆介平,孙志挥.基于向量内积不等式的分布式k均值聚类算法[J].计算机研究与发展,2005,42(9):1493-1497. 被引量：15
7李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
8李俊韬,张海,范跃祖.复杂交通场景中多运动目标分割算法[J].北京航空航天大学学报,2006,32(3):297-300. 被引量：3
9任江涛,施潇潇,孙婧昊,黄焕宇,印鉴.一种改进的基于特征赋权的K均值聚类算法[J].计算机科学,2006,33(7):186-187. 被引量：10
10倪巍伟,陆介平,陈耿,孙志挥.基于k均值分区的数据流离群点检测算法[J].计算机研究与发展,2006,43(9):1639-1643. 被引量：20

共引文献178

1王海,高岭,陈东棋,任杰.一种基于用户行为的嵌入式功耗优化方法[J].系统仿真学报,2015,27(2):320-326.
2周爱武,汪贤惠,刘慧婷.基于HowNet词汇相关性的文本聚类[J].微电子学与计算机,2015,32(4):90-93. 被引量：4
3陈兴蜀,吴小松,王文贤,王海舟.基于特征关联度的K-means初始聚类中心优化算法[J].四川大学学报（工程科学版）,2015,47(1):13-19. 被引量：29
4刘星,毕奇龙,郑付刚.基于蚁群K均值聚类算法的边坡稳定性分析[J].水电能源科学,2010,28(8):108-109. 被引量：5
5张秀容,杨亚娟,向景红.松辽盆地南部深层火山岩识别及成藏条件分析[J].勘探地球物理进展,2006,29(3):211-215. 被引量：27
6李新蕊.主成分分析、因子分析、聚类分析的比较与应用[J].山东教育学院学报,2007,22(6):23-26. 被引量：128
7陈维克,闫新庆,李文锋,袁兵.无线传感器网络动态调度分簇算法[J].华中科技大学学报（自然科学版）,2008,36(10):86-90. 被引量：3
8郭秀娟,战冬梅.K-means聚类算法分析及在教师授课质量评价中的应用[J].吉林工程技术师范学院学报,2009,25(6):74-77. 被引量：9
9张坤华,杨烜.应用聚类和分形实现复杂背景下的扩展目标分割[J].光学精密工程,2009,17(7):1665-1671. 被引量：11
10刘金岭.基于语义的中文文本聚类最佳簇数研究[J].计算机工程与设计,2010,31(9):2034-2036.

同被引文献113

1朱颢东,钟勇,赵向辉.一种优化初始中心点的K-Means文本聚类算法[J].郑州大学学报（理学版）,2009,41(2):29-32. 被引量：13
2张红荣,张峰.传统的K-means聚类算法的研究与改进[J].咸阳师范学院学报,2010,25(4):59-62. 被引量：4
3卢嘉锡.既是“龙尾”也是“龙头”——要重视并做好科技期刊工作[J].中国科技期刊研究,1990,1(1):2-2. 被引量：72
4陈小全,张继红.基于改进粒子群算法的聚类算法[J].计算机研究与发展,2012,49(S1):287-291. 被引量：31
5司永胜,刘刚,高瑞.基于K-均值聚类的绿色苹果识别技术[J].农业机械学报,2009,40(S1):100-104. 被引量：50
6逄玉俊,柳明,李元.k均值聚类分析在过程改进中的应用[J].华中科技大学学报（自然科学版）,2009,37(S1):245-247. 被引量：9
7白雪冰,王克奇,王辉.基于灰度共生矩阵的木材纹理分类方法的研究[J].哈尔滨工业大学学报,2005,37(12):1667-1670. 被引量：90
8李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
9袁方,周志勇,宋鑫.初始聚类中心优化的k-means算法[J].计算机工程,2007,33(3):65-66. 被引量：157
10陈健,印鉴.基于影响集的协作过滤推荐算法[J].软件学报,2007,18(7):1685-1694. 被引量：59

引证文献15

1宋志飞,彭金莲.海南农垦耕地类型的聚类分析[J].计算机应用研究,2020,37(S01):88-91. 被引量：2
2孙庚,冯艳红,郭显久,张春平.K-means聚类算法研究[J].长春师范学院学报（自然科学版）,2011,30(1):1-4. 被引量：9
3张琳,陈燕,汲业,张金松.一种基于密度的K-means算法研究[J].计算机应用研究,2011,28(11):4071-4073. 被引量：44
4张阳,申华.基于近邻用户和近邻项目的协同过滤改进算法[J].沈阳师范大学学报（自然科学版）,2012,30(3):382-385.
5曹婧蕾,李军华.基于图像处理的血液透析器纤维识别计数[J].计算机系统应用,2012,21(10):166-170.
6霍亮,杨柳,周志勇.一种降低噪音数据对k-means聚类结果影响的改进算法[J].科技通报,2013,29(9):123-125.
7邓海,覃华,孙欣.一种优化初始中心的K-means聚类算法[J].计算机技术与发展,2013,23(11):42-45. 被引量：22
8杨金花,刘显为.K-means聚类算法初始中心选择研究[J].河南科学,2016,34(3):348-351. 被引量：7
9蔡娟,李东新.基于优化k均值建模的运动目标检测算法[J].国外电子测量技术,2016,35(12):20-23. 被引量：17
10吴德浩,陈茂银,周东华.基于改进K均值算法的滚动轴承故障诊断[J].山东科技大学学报（自然科学版）,2017,36(4):1-8. 被引量：5

二级引证文献131

1佐磊,胡小敏,何怡刚,孙洪凯,李兵.小样本数据处理的加速寿命预测方法[J].电子测量与仪器学报,2020,32(11):26-32. 被引量：8
2龙珊珊,信瑞山.基于人工智能图像识别的输电线路巡检研究[J].电子测量技术,2023,46(6):116-121. 被引量：18
3王秀芳,王岩.优化K均值随机初始中点的改进算法[J].化工自动化及仪表,2012,39(10):1302-1304. 被引量：4
4郑攀,庹武.基于K-means聚类算法的女裤弹性面料分类研究[J].国际纺织导报,2014,42(5):71-72. 被引量：1
5常娥.基于LSI理论的文本自动聚类研究[J].图书情报工作,2012,56(11):89-92. 被引量：5
6郑丹,王潜平.K-means初始聚类中心的选择算法[J].计算机应用,2012,32(8):2186-2188. 被引量：35
7詹辉煌,朱敏琛.一种改进的动态K-means聚类算法[J].微型机与应用,2012,31(20):74-76. 被引量：2
8李力沛.一种改进的聚类簇数目自动计算算法[J].现代计算机（中旬刊）,2012(10):13-16.
9姜万录,刘云杰,朱勇.小波脊线解调与两次EMD分解相结合的故障识别方法及应用研究[J].仪器仪表学报,2013,34(5):1131-1138. 被引量：11
10翟东海,聂洪玉,崔静静,杜佳.基于自适应簇中心选择的文本聚类算法研究[J].成都信息工程学院学报,2013,28(6):617-622. 被引量：1

1屈新怀,高万里,丁必荣,李朕.基于聚类数和初始值的K-means算法改进研究[J].组合机床与自动化加工技术,2011(4):42-46. 被引量：6
2刘明术.基于K-均值聚类的混合聚类算法[J].安庆师范学院学报（自然科学版）,2016,22(1):40-42. 被引量：3
3安建成,史德增.一种改进的K-means算法[J].电脑开发与应用,2011,24(4):39-40. 被引量：6
4顾洪博,张继怀.基于孤立点和初始质心选择的k-均值改进算法[J].长江大学学报（自科版）（上旬）,2009,6(1):60-62. 被引量：7
5顾洪博,苏冬娜.基于孤立点和初始质心选择的k均值算法的改进与应用[J].陕西理工学院学报（自然科学版）,2009,25(3):45-49. 被引量：4
6马仕玉,李益才,蓝章礼.一种具有优良抗噪性能的初始聚类质心选择算法[J].计算机科学,2014,41(S1):406-408.
7邹汪平,方元康,吴伟.基于图谱理论几何空间结构变换的大数据核聚类算法[J].计算机应用研究,2016,33(8):2331-2334. 被引量：2
8田诗宵,丁立新,郑金秋.基于密度峰值优化的K-means文本聚类算法[J].计算机工程与设计,2017,38(4):1019-1023. 被引量：27
9王浩,高金吉,江志农,马波.基于案例推理的旋转机械故障诊断系统研究[J].科学技术与工程,2012,20(29):7585-7591. 被引量：7
10张真,任贺宇.一种基于动态网格技术的K-means初始质心选取算法[J].微电子学与计算机,2013,30(6):101-104. 被引量：2

沈阳师范大学学报（自然科学版）

2009年第4期

浏览历史

内容加载中请稍等...

K均值聚类算法初始质心选择的改进被引量：15

参考文献9

二级参考文献50

共引文献178

同被引文献113

引证文献15

二级引证文献131

相关作者

相关机构

相关主题

浏览历史

K均值聚类算法初始质心选择的改进 被引量：15

参考文献9

二级参考文献50

共引文献178

同被引文献113

引证文献15

二级引证文献131

相关作者

相关机构

相关主题

浏览历史

K均值聚类算法初始质心选择的改进被引量：15