一种基于排序划分的聚类初始化方法被引量：3

An Initialization Method for Clustering Center Based on Sorting and Partition

下载PDF

导出

摘要 k-means聚类算法,是在d维空间Rd里把n个数据对象划分为K个类,其划分原则是计算每个数据对象与K个聚类中心的距离并将其分配到最近的一个类.传统直接k-means算法是随机选取初始中心的,不同的初始中心会产生不同的聚类结果,针对这个不足,提出了一种基于排序划分的聚类初始化方法,该方法简单易于实现,将其应用在真实数据集和模拟数据集上,实验表明在处理非高维数据上这是一种简单而有效的方法,在很大程度上提高了聚类精度和效率. In k-means clustering, we are given a set of n data points in d-dimensional space Raand an integer K the problem is to determine a set of K points in/U, called centers, so as to minimize the mean squared distance from each data point to its nearest center. The initial centers of direct k-means algorithm are chosen randomly, different initial centers will lead to different results. In this paper, in view of the deficiency of direct k-means algorithm, we propose a novel method about initial centers based on sorting and partition and apply it to real data as well as simulated data, which show that this is a simple and efficient method to improve the clustering accuracy and efficiency.

作者殷君伟陈建明薛百里张健

机构地区苏州大学计算机科学与技术学院

出处《微电子学与计算机》 CSCD 北大核心 2013年第6期80-83,87,共5页 Microelectronics & Computer

关键词 K-MEANS 排序划分聚类分析初始中心 k- means sorting and partition clustering analysis initial centers

分类号 TP302 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1FAHIM A.M,SALEM A.M,TORKEY F.A,RAMADAN M.A.An efficient enhanced k-means clustering algorithm[J].Journal of Zhejiang University-Science A(Applied Physics & Engineering),2006,7(10):1626-1633. 被引量：30

共引文献29

1彭辉,任继平,吴兰兰,陆尚平.基于改进的K-均值聚类算法的农作物图像分割[J].农机化研究,2008,30(6):57-60. 被引量：2
2高哲,魏海平,王福威,赵晓碧.基于Web日志挖掘的Web文档聚类[J].计算机工程与设计,2008,29(18):4708-4710. 被引量：5
3李学,苗夺谦,冯琴荣.基于数据场的粗糙聚类算法[J].计算机科学,2009,36(2):203-206. 被引量：9
4李琳,李肯立.基于图形处理器的划分聚类算法效率研究[J].计算机应用研究,2009,26(4):1276-1278. 被引量：2
5张健沛,杨悦,杨静,张泽宝.基于最优划分的K-Means初始聚类中心选取算法[J].系统仿真学报,2009,21(9):2586-2590. 被引量：62
6王慧,申石磊.基于改进的K均值聚类彩色图像分割方法[J].电脑知识与技术,2010(2):962-964. 被引量：6
7刘静,罗卫敏,刘井波.基于逐级均值聚类的信息熵的离散化算法[J].计算机应用研究,2010,27(9):3368-3371. 被引量：1
8杨鹤标,薛艳锋,冯进兰,沈项军,吴静丽.基于Fisher线性判别率的加权K-means聚类算法[J].计算机应用研究,2010,27(12):4439-4442. 被引量：5
9Suiang-Shyan LEE,Ja-Chen LIN.An accelerated K-means clustering algorithm using selection and erasure rules[J].Journal of Zhejiang University-Science C(Computers and Electronics),2012,13(10):761-768. 被引量：6
10张玉珠.基于K-means聚类的网络舆情监控系统[J].通信技术,2013,46(1):57-59. 被引量：3

同被引文献32

1林春实,方燕,全吉成.汉语文献自动分词与标引技术发展浅析[J].情报学报,1997,16(S1):37-40. 被引量：8
2李永森,杨善林,马溪骏,胡笑旋,陈增明.空间聚类算法中的K值优化问题研究[J].系统仿真学报,2006,18(3):573-576. 被引量：39
3吕强,高彦明,钱培德.共享信息素矩阵:一种新的并行ACO方法[J].自动化学报,2007,33(4):418-421. 被引量：11
4化柏林.知识抽取中的停用词处理技术[J].现代图书情报技术,2007(8):48-51. 被引量：41
5Shekhar S,Chawla S.谢昆青,等.空间数据库[M].北京:机械工业出版社,2004,1～300.
6邓敏,刘启亮,李光强,等.空间聚类分析及应用[M].北京:科学出版社,2011.
7MacQueen J. Some methods for classification and analysis of multi-variate observations [ C ]//Proc of the 5th Berkeley symposium on mathematical statistics and probability. Berke- ley, USA : Univ of Calif Press, 1967:281-297.
8Asgharbeygi N, Maleki A. Geodesic K-means clustering [ C ] //Proc of 19th international conference on pattern recogni- tion. Tampa, FL: IEEE,2008 : 1-4.
9Lanthier M, Maheshwari A, Sack J R. Approximating weighted shortest paths on polyhedral surfaces [ C ]//Proc of symposium on computational geometry. [ s. 1. ] : [ s. n. ], 1999:274-283.
10Mitchell J S B, Mount D M, Papadimitriou C H. The discrete geodeic problem [ J ]. SIAM Journal on Computing, 1987,16 (4) :647-668.

引证文献3

1杨永涛,李静.一种改进的K-means数字资源聚类算法[J].计算机技术与发展,2014,24(6):107-109. 被引量：1
2谢梦燕,黄旭,赵青,王俊辉.一种不规则形状聚类算法[J].西安文理学院学报（自然科学版）,2015,18(3):5-8.
3廉文娟,史丹丹,安其立,贾斌.基于最大期望的初始聚类中心选择算法[J].软件,2020,41(5):1-5. 被引量：4

二级引证文献5

1彭杨.基于Hadoop的文本分析算法研究与实践[J].信息与电脑,2020,32(24):48-51.
2李坤坤,曹锐,杨耀东,徐润田.基于高斯混合模型的平流层浮空器RCS分布拟合[J].电子测量技术,2021,44(19):110-115. 被引量：1
3刘哲,闫佳文,陈长金,蒋春悦,耿立卓,安会.电力线图像检测方法研究[J].机械与电子,2022,40(3):54-57. 被引量：2
4康玮,曹文庚,徐丽霞,南天,高媛媛,聂子一.基于k-means聚类与泰森去丛聚的代表性地下水位计算方法[J].南水北调与水利科技（中英文）,2022,20(5):876-885. 被引量：5
5徐志博,刘永生,户盼茹.结合离群因子和K-means++聚类改进的点云去噪算法[J].信息技术与信息化,2023(3):21-24. 被引量：9

1徐红波,胡文,潘海为,高祥,刘润涛.高维空间范围查询并行算法研究[J].哈尔滨商业大学学报（自然科学版）,2013,29(1):73-75. 被引量：2
2黄永明,章国宝,董飞,李悦.层叠式“产生/判别”混合模型的语音情感识别[J].声学学报,2013,38(2):231-240. 被引量：3
3宋传鸣,王相海.最长d维箱嵌套问题的贪心算法[J].计算机科学,2003,30(12):161-163. 被引量：1
4付芩.二维设计与三维设计的分析比较与图形转换[J].江汉大学学报（自然科学版）,2009,37(3):72-74. 被引量：7
5李捷,张天序.基于多尺度分形参数变化的目标检测方法研究[J].数据采集与处理,1996,11(3):218-221. 被引量：6
6周秀玲.d维自助式类渗流细胞自动机模型临界值为零的一个充分条件[J].北京师范大学学报（自然科学版）,1999,35(3):323-327.
7李焰峰,李真,李汉斌,张学杰.基于Content-Addressable Network的对等网络研究[J].云南大学学报（自然科学版）,2007,29(S2):249-253.
8张吉祥,甘晶,陈惠明.新型井道式电梯远程实时监测和报警系统[J].自动化仪表,2013,34(4):41-43. 被引量：2
9林仙丽,傅清祥.矩形集上的点定位[J].福州大学学报（自然科学版）,1999,27(4):24-28.
10陈鹏.基于改进的图像局部区域相似度学习架构的图像特征匹配技术研究[J].网络安全技术与应用,2016(4):44-45.

微电子学与计算机

2013年第6期

浏览历史

内容加载中请稍等...

一种基于排序划分的聚类初始化方法被引量：3

参考文献1

共引文献29

同被引文献32

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种基于排序划分的聚类初始化方法 被引量：3

参考文献1

共引文献29

同被引文献32

引证文献3

二级引证文献5

相关作者

相关机构

相关主题

浏览历史

一种基于排序划分的聚类初始化方法被引量：3