云环境下基于二进制编码聚类的并行频繁项集挖掘算法被引量：1

A Parallel Frequent Itemsets Mining Algorithm Based on Binary Coding and Clustering under Cloud Environment

下载PDF

导出

摘要本文提出了一种云环境下基于二进制编码的并行频繁项集挖掘算法,利用一种特殊的二进制编码的依赖度计量方法对原始数据集合进行编码转换及依赖度聚类,然后将数据集分布部署在云环境中,并采用共享多头表的FP-Growth并行改进算法挖掘频繁项集.实验表明,对于大规模数据集来说,本文算法可以取得良好的性能. This paper proposes a parallel frequent itemsets mining algorithm based on binary coding under cloud environment.A special binary coding dependency calculating method is adopted to transfer the raw data and cluster based on dependency,then the data is distributed deployed in cloud environment and the parallel improved algorithm of FP-Growth based on shared multi-head table is used to mine frequent item sets.Experiments show that the algorithm performed nicely with large scale of data sets.

作者刘博李云张晓斌徐杰

机构地区扬州大学信息工程学院

出处《微电子学与计算机》 CSCD 北大核心 2012年第11期62-65,共4页 Microelectronics & Computer

基金国家自然科学基金(61070047 61070133) 江苏省自然科学基金(BK2010134) 江苏省教育厅自然科学基金(11KJD520011)

关键词云计算二进制编码聚类并行频繁项集 cloud computing binary coding clustering parallel frequent itemsets

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1Agrawal Rakesh, Ramakrishnan Srikant. Fast algo-rithms for mining association rules in large databases[C] // Proceedings of 20th International Conference onVery Large Data Bases, 1994 ; 487-499.
2Jiawei Han, Jian Pei,Yiwen Yin. Mining frequentpatterns without candidate generation[[C] // Proceed-ings of the ACM SIGMOD International Conference onManagement of Data, 2000,29(2): 1-12.
3Zaiane O R,El-Hajj M,Lu P. Fast parallel associa-tion rule mining without candidacy generation [C] //Proceedings of IEEE International Conference on DataMining, 2001 : 665-668.
4Javed A, Khokhar A. Frequent Pattern Mining onMessage Passing Muhiprocessor Systems[J]. Distrib-uted and Parallel Databases, 2004 ,16(3) : 321-334.
5Haoyuan Li, Yi Wang, Dong Zhang,Ming Zhang,and Edward Y. Chang. PFP : Parallel FIMirowth forQuery Recommendation[C]// Proceedings of the 2008ACM Conference on Recommender Systems, 2008 :107-114.
6McCormick W T,Sehweitzer P J. Problem decomposi-tion and data reorganization by a clustering technique[J]. Operations Research, 1972?20(5): 993-1009.

同被引文献9

1秦亮曦,苏永秀,刘永彬,梁碧珍.基于压缩FP-树和数组技术的频繁模式挖掘算法[J].计算机研究与发展,2008,45(z1):244-249. 被引量：16
2[美]韩家炜.数据挖掘:概念与技术[M].第三版.范明,等译.北京:机械工业出版社,2012.
3陈国良.并行算法的设计与分析[M].北京:高等教育出版社,2011.
4马青霞,李广水,郑滔.多谓词约束下基于模式增长的频繁项集挖掘算法[J].计算机技术与发展,2011,21(10):116-120. 被引量：1
5申彦,宋顺林,朱玉全.基于磁盘表存储FP-TREE的关联规则挖掘算法[J].计算机研究与发展,2012,49(6):1313-1322. 被引量：14
6王洁,戴清灏,曾宇,杨东日.云制造环境下并行频繁模式增长算法优化[J].计算机集成制造系统,2012,18(9):2124-2129. 被引量：5
7吕雪骥,李龙澍.FP-Growth算法MapReduce化研究[J].计算机技术与发展,2012,22(11):123-126. 被引量：18
8周爱武,王琰,陈宝楼.一种基于FUP的TD-FP-Tree并行快速更新算法[J].计算机技术与发展,2013,23(4):91-95. 被引量：2
9王智钢,王池社,马青霞.分布式并行关联规则挖掘算法研究[J].计算机应用与软件,2013,30(10):113-115. 被引量：13

引证文献1

1杨向荣,王希武.基于规则约束的并行FP-Growth算法研究[J].计算机与数字工程,2015,43(11):1933-1936. 被引量：2

二级引证文献2

1南楠.基于关联规则的银行潜在客户挖掘研究[J].电子商务,2016,17(8):48-50. 被引量：2
2孟月昊,冯文,林荣霞,陈铭师.前后部项约束关联规则并行化算法[J].计算机时代,2021(8):1-7.

1唐沛来.采用分布式技术重塑证券公司IT架构[J].金融电子化,2016(12):46-48.
2张鹏,白朝旭,王锟,郭滨,梅峰,刘红娥.基于Quartz的集团化调度任务分布部署研究[J].现代电子技术,2014,37(2):80-83. 被引量：6
3王爱俊,祖翔.面向广域网的IPSDN&NFV控制系统研究[J].电信技术,2016(7):30-34.
4孙伟,朱正礼,郑磊,侯迎坤.基于人工鱼群和微粒群混合算法的WSN节点部署策略[J].计算机科学,2012,39(11):83-85. 被引量：9
5王速瑜,林昊.架构师接龙王速瑜vs.林昊[J].程序员,2009(9):74-75.
6杨旸.基于Redis的Thrift缓存机制设计[J].软件导刊,2016,15(3):29-32. 被引量：3
7吴斌,胡跃青,谈韵.短信平台促进信息化深化应用[J].华东电力,2009,37(9):1559-1561. 被引量：2
8孙泳,史忠植.MRTG的研究与部署[J].计算机应用,2004,24(3):22-24. 被引量：15
9梁琰,陈海鹏,马力.装备IETM集中管理设想[J].电子产品可靠性与环境试验,2013,31(A01):106-109. 被引量：1
10黄兰,余阳,李长森,文东海.XForm在工作流管理系统中的应用研究[J].计算机工程与应用,2007,43(6):81-84. 被引量：5

微电子学与计算机

2012年第11期

浏览历史

内容加载中请稍等...

云环境下基于二进制编码聚类的并行频繁项集挖掘算法被引量：1

参考文献6

同被引文献9

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

云环境下基于二进制编码聚类的并行频繁项集挖掘算法 被引量：1

参考文献6

同被引文献9

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

云环境下基于二进制编码聚类的并行频繁项集挖掘算法被引量：1