并行聚类算法的设计与研究被引量：2

Design and Research of Parallel Clustering Algorithm

下载PDF

导出

摘要在处理海量数据集时,由于单台计算机的处理能力有限,利用传统的聚类算法难以在有效的时间内获得聚类结果。在基于密度和自适应密度可达聚类算法的基础上,提出一种并行聚类算法。理论和实验结果证明该算法具有接近线性的加速比,能够有效地处理大规模的数据集。 During dealing with massive data sets,a single computer＇s power is limited.The traditional clustering algorithms are difficult to obtain the results in the short time.To overcome these problems,a new parallel clustering algorithm is presented according to the analysis of clustering algorithm based on density and adaptive density-reachable.Theoretical analysis and experimental results demonstrate that the algorithm is near-linear speed-up ratio,and can handle the massive data sets effectively.

作者孟海东杨彦侃

机构地区内蒙古科技大学信息工程学院

出处《计算机与现代化》 2010年第8期5-7,14,共4页 Computer and Modernization

基金国家自然科学基金资助项目(40762003) 内蒙古自然科学基金资助项目(200711020814)

关键词并行聚类海量数据集群 parallel clustering massive data sets cluster computer

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献12

1毛嘉莉,万敏,陈华月.机群环境下的并行K-means算法[J].宜宾学院学报,2007,7(12):91-93. 被引量：3
2彭厚文,杨爽,何凤成.基于聚类算法的并行化研究[J].电脑知识与技术,2009,5(8X):7010-7012. 被引量：2
3单劲松.一种基于层次聚类的流数据挖掘方法[J].太原师范学院学报（自然科学版）,2008,7(4):72-74. 被引量：1
4何孝金,傅彦,陈安龙.基于相对距离的密度聚类算法[J].计算机应用研究,2009,26(4):1335-1337. 被引量：3
5荣莹,曹俊兴.基于MPI的机群并行计算系统平台构建[J].物探化探计算技术,2005,27(1):89-91. 被引量：7
6赵中堂,孙申利,范喆.基于MPI的并行聚类算法[J].郑州航空工业管理学院学报（社会科学版）,2005,24(3):160-160. 被引量：2
7周兵,冯中慧,王和兴.集群环境下的并行聚类算法之研究[J].计算机科学,2007,34(10):195-199. 被引量：2
8王辉,张望,范明.基于集群环境的K-Means聚类算法的并行化[J].河南科技大学学报（自然科学版）,2008,29(4):42-45. 被引量：10
9孟海东,王淑玲,郝永宽.动态增量聚类的设计与实现[J].计算机工程与应用,2009,45(24):130-132. 被引量：7
10李琳,李肯立.基于图形处理器的划分聚类算法效率研究[J].计算机应用研究,2009,26(4):1276-1278. 被引量：2

二级参考文献67

1金澈清,钱卫宁,周傲英.流数据分析与管理综述[J].软件学报,2004,15(8):1172-1181. 被引量：163
2吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504. 被引量：141
3周水庚,周傲英,金文,范晔,钱卫宁.FDBSCAN:一种快速 DBSCAN算法(英文)[J].软件学报,2000,11(6):735-744. 被引量：42
4李庆华,苏珊.一种应用于入侵检测的并行聚类算法[J].计算机工程,2005,31(5):151-152. 被引量：1
5蒋盛益,李庆华,李新.数据流挖掘算法研究综述[J].计算机工程与设计,2005,26(5):1130-1132. 被引量：21
6刘维峰,卢伟,许海燕.基于局域网和MPI的PC集群计算环境[J].计算机工程与设计,2005,26(5):1327-1329. 被引量：9
7田金兰,朱林,张素琴,刘璐.Improvement and Parallelism of k-Means Clustering Algorithm[J].Tsinghua Science and Technology,2005,10(3):277-281. 被引量：2
8陈卓,孟庆春,魏振钢,任丽婕,窦金凤.一种基于网格和密度凝聚点的快速聚类算法[J].哈尔滨工业大学学报,2005,37(12):1654-1657. 被引量：14
9金松河,钱慎一,张素智.基于Web日志的高精度聚类算法[J].河南科技大学学报（自然科学版）,2006,27(2):49-51. 被引量：4
10孟海东,张玉英.基于密度和对象方向聚类算法的改进[J].计算机工程与应用,2006,42(20):154-156. 被引量：14

共引文献41

1朱星明,涂彬,陈煜,白婧怡,耿庆斋.水利科学计算并行计算平台构建及算法实践[J].水利水电技术,2006,37(8):121-125. 被引量：5
2熊齐,易明.Linux环境下PC并行机群的设计与实现[J].信息技术,2007,31(4):84-86. 被引量：2
3付新涛,刘羽.MPI在Windows平台两种存储模式下的实现与比较[J].中国科技信息,2007(18):118-119.
4孟海东,郝永宽,宋飞燕,格日勒图.遥感图像非监督计算机分类方法的研究[J].计算机与现代化,2008(7):66-69. 被引量：7
5邓超,朱星明.高性能水利科学计算平台测试分析[J].中国水利水电科学研究院学报,2009,7(1):51-56. 被引量：2
6宋宇辰,卢胜利,房宜锋.基于数据挖掘高校图书资料需求特征分析[J].图书馆学刊,2009,31(4):12-14.
7白雅兰,袁道华.基于MPI的基因芯片数据处理模型[J].计算机工程与设计,2009,30(10):2419-2422.
8孟海东,王淑玲,郝永宽.动态增量聚类的设计与实现[J].计算机工程与应用,2009,45(24):130-132. 被引量：7
9孟海东,郝永宽,王淑玲.聚类分析在非监督图像分类中的应用研究[J].计算机与现代化,2009(10):88-91. 被引量：3
10孟海东,姚继营.数字遥感图像解译分类方法研究[J].金属矿山,2010,39(6):139-141. 被引量：3

同被引文献24

1艾树宇. 基于Hadoop/MapReduce的K_NN算法[J]. 科技传播, 2013(1):203-204,200.
2王淑玲. 增量聚类算法的设计与实现[D]. 包头:内蒙古科技大学, 2009.
3周迎春,骆嘉伟.一种改进的BIRCH聚类分析算法及其应用研究[J].湛江师范学院学报,2009,30(3):83-87. 被引量：6
4何永斌.云南少数民族非物质文化遗产的特点与保护策略[J].西南民族大学学报（人文社会科学版）,2009,30(8):23-26. 被引量：7
5丁光华,周继鹏,周敏.基于MapReduce的并行贝叶斯分类算法的设计与实现[J].微计算机信息,2010,26(9):190-191. 被引量：5
6施佺,肖仰华,温文灏,朱乾钱,王恒山.基于Mapreduce的大规模社会网络提取方法研究[J].计算机应用研究,2011,28(1):145-148. 被引量：4
7李成华,张新访,金海,向文.MapReduce:新型的分布式并行计算编程模型[J].计算机工程与科学,2011,33(3):129-135. 被引量：113
8戎翔,李玲娟.基于MapReduce的频繁项集挖掘方法[J].西安邮电学院学报,2011,16(4):37-39. 被引量：24
9李锐,王斌.文本处理中的MapReduce技术[J].中文信息学报,2012,26(4):9-20. 被引量：18
10梁建武,周杨.一种异构环境下的Hadoop调度算法[J].中国科技论文,2012,7(7):495-497. 被引量：4

引证文献2

1闫斐,吴晴晴,周俊华.云南省边境县发展状况的聚类分析与空间分异治理[J].文山学院学报,2021(1):9-14. 被引量：1
2顾瑞春,王静宇.一种基于MapReduce的并行聚类模型[J].计算机与现代化,2014(1):90-92. 被引量：1

二级引证文献2

1单志佳,席耀一,唐永旺,杨航,张新宇.基于KNN算法的大数据话题追踪技术研究[J].信息工程大学学报,2019,20(3):379-384. 被引量：1
2马东东,杨亮英.我国边境治理研究述评[J].青藏高原论坛,2024,12(1):32-41.

1阎仲璞,邵秀丽,张峰.并行聚类分析算法(英文)[J].南开大学学报（自然科学版）,2008,41(4):106-112.
2陈敏,郗玉平.一种新的并行聚类算法[J].中国电子商情（通信市场）,2009(6):173-176.
3陈敏,高学东,栾绍峻,郗玉平.基于密度的并行聚类算法[J].计算机工程,2010,36(11):8-10. 被引量：9
4李青华,马春波.基于并行聚类算法的无监督异常检测研究[J].舰船电子工程,2012,32(1):79-82. 被引量：2
5赵中堂,李春雷.基于移动Agent的并行聚类算法模型[J].中原工学院学报,2005,16(1):40-43. 被引量：1
6郑洪英,倪霖,肖迪.大规模数据集聚类中的数据分区及应用研究[J].计算机应用研究,2007,24(2):203-205. 被引量：1
7孟海东,宋飞燕,宋宇辰.面向复杂簇的聚类算法研究与实现[J].计算机应用与软件,2008,25(10):32-34. 被引量：4
8宋宇辰,宋飞燕,孟海东.基于密度复杂簇聚类算法研究与实现[J].计算机工程与应用,2007,43(35):162-165. 被引量：16
9牛新征,佘堃.面向大规模数据的快速并行聚类划分算法研究[J].计算机科学,2012,39(1):134-137. 被引量：22
10韦火旺,钟诚.基于并行聚类的物联网k-匿名算法[J].信息技术,2013,37(12):6-10. 被引量：2

计算机与现代化

2010年第8期

浏览历史

内容加载中请稍等...

并行聚类算法的设计与研究被引量：2

参考文献12

二级参考文献67

共引文献41

同被引文献24

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

并行聚类算法的设计与研究 被引量：2

参考文献12

二级参考文献67

共引文献41

同被引文献24

引证文献2

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

并行聚类算法的设计与研究被引量：2