基于粗糙集的改进Apriori算法研究被引量：10

Improved Apriori Algorithm Based on Rough Set

下载PDF

导出

摘要针对Apriori算法的不足,提出一种基于粗糙集的频繁项集发现方法。新方法首先利用粗糙集的特征属性约简算法进行属性约简,找到其中的核心属性数据,然后在构建约简决策表的基础上应用改进的Apriori算法对这些核心数据进行数据挖掘,最终得到频繁项集。改进方法的优势在于在保证知识库分类能力不变的前提下消除不必要的冗余属性,减少了属性数目。在生成频繁项目集方面,根据k-1频繁项集中的项目个数来确定是否生成对应的k-候选集,这样就不需要进行连接操作生成k-候选集,减少了候选项集的生成数量。实验验证了所提出的改进算法的有效性,尤其在k很大的时候,可以节省大量的计算时间,避免产生大量的候选集,可显著提高数据挖掘的效率。 Aiming at the defects of the Apriori algorithm, this paper proposed a method for the discovery of fre- quent item set based on rough set. Firstly, this method uses characteristics attributes reduction algorithm of rough set to find the core of the attribute data, and then uses the improved Apriori algorithm on the data mining of these core data based on the reduction decision table to get frequent item set. The advantage of this method is that it can elimi- nate unnecessary attributes and reduce the number of attributes on the premise of the same knowledge base classifica- tion ability. In terms of generating frequent item set, whether the k-candidate set is generated is determined by the number of k-1 frequent item set, In this way the number of candidate item set can be reduced. The experiment veri-fies the validity of the improved algorithm, especially when k is a great number. It can save a lot of computing time, avoid a lot of candidate set, and improve the efficiency of data mining significantly.

作者崔旭刘小丽

机构地区延边大学工学院北京科技大学自动化学院

出处《计算机仿真》 CSCD 北大核心 2013年第1期329-332,385,共5页 Computer Simulation

关键词粗糙集候选集频繁项集 Rough set Candidate set Frequent item set

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1张文修;吴伟志.粗糙集理论与方法[M]北京:科学出版社,2001.
2Han Jiawei,M Kamber. Data mining concepts and techniques[M].San Francisco,ca:morgan Kaufmann Publishers,2005.
3A Savasere,E Omiecinski,S Navatiie. An efficient algorithm for mining association rules in large database[A].San Francisco,ca:morgan Kaufmann Publishers,1995.432-443.
4N Pasquier,Y Bastide. Discovering frequent closed item sets for association rules[A].Lodon:Springer-Verlag,1999.398-416.
5Hart Jiawei,Pel Jian. Mining frequent patterns without candidate generation[A].New York:ACM,2000.1-12.
6F Berzal,J Cubero,N Marin. TBAR:An efficient method for association rule mining in relational databases[J].Data anti Knowledge Engineering,2001,(01):47-64.

同被引文献95

1刘双跃,杨蕾,彭丽.基于改进Apriori算法的煤矿物态隐患系统设计与应用[J].煤炭技术,2015,34(4):318-320. 被引量：6
2徐章艳,刘美玲,张师超,卢景丽,区玉明.Apriori算法的三种优化方法[J].计算机工程与应用,2004,40(36):190-192. 被引量：71
3宾宁,李宏,陈松乔.基于SPRINT分类算法的异构分布式数据挖掘研究[J].计算机测量与控制,2005,13(1):76-78. 被引量：6
4岳一领,李东生.基于数据挖掘技术的煤矿远程监控系统研究[J].太原理工大学学报,2005,36(2):211-215. 被引量：26
5菅希顺,刘瑞霞.数据挖掘技术及其在钢铁领域应用概述[J].天津冶金,2006(1):39-42. 被引量：4
6陈晓云,陈袆,王雷,李荣陆,胡运发.基于分类规则树的频繁模式文本分类[J].软件学报,2006,17(5):1017-1025. 被引量：19
7聂兴信,刘书香.数字化矿山构建过程中的数据挖掘模型研究[J].金属矿山,2007,36(6):19-21. 被引量：18
8Chen C, Shen J, Chert B, et al. An improvement Apriori arithmetic based on rough set theory. 2011 Third Pacific Asia Conference on circuits, Communications and System. 2011.1-3.
9Chen Z, Cai S, Song Q, et al. An improved Apriori algorithm based on pruning optimization and transaction reduction. 2nd International Conference on Artificial Intelligence, Management Science and Electronic Commerce. 2011. 1908-1911.
10Burdick D, Calimlim M, Flannick J, et al. Mafia: A maximal frequent itemset algorithm. IEEE Trans. on Knowledge and Data Engineering, 2005, 17(11): 1490-1504.

引证文献10

1胡燕,郑忠.基于粗糙集的转炉炼钢知识发现模型[J].重庆大学学报（自然科学版）,2014,37(3):58-63. 被引量：6
2吴学雁,莫赞.基于Aproiri算法的频繁项集挖掘优化方法[J].计算机系统应用,2014,23(6):124-129. 被引量：8
3赵文涛,付侃侃,李素青,张霄宏.基于随机相遇的频繁项集挖掘方法[J].河南理工大学学报（自然科学版）,2015,34(1):81-84. 被引量：3
4胡绿慧,任玉兰,何振林.基于划分和压缩数据库的改进Apriori算法[J].成都理工大学学报（自然科学版）,2015,42(1):110-114. 被引量：11
5王斌,王金,宁小倩.基于黄金比例的关联规则挖掘算法[J].计算机仿真,2015,32(8):302-305. 被引量：6
6朱付保,白庆春,汤萌萌,朱颢东.基于改进Apriori算法的铁路轨道质量分析与评价[J].微电子学与计算机,2015,32(10):159-162. 被引量：5
7叶海琴,廖利,王意锋,张爱玲.一种新的频繁模式挖掘算法[J].南京理工大学学报,2016,40(1):29-34. 被引量：2
8田秀娟.网络环境中不完整数据挖掘方法研究与仿真[J].计算机仿真,2016,33(10):454-457. 被引量：4
9曹佳豪,刘宇.基于多叉树和Spark的改进Apriori算法[J].信息技术,2018,42(6):128-132. 被引量：3
10徐浙君.改进的Apriori算法在云计算挖掘下的研究[J].科技通报,2019,35(2):54-58. 被引量：2

二级引证文献49

1齐娇娇.基于改进Apriori算法的运动员多属性训练数据挖掘模型构建及仿真[J].微型电脑应用,2018,34(12):137-139. 被引量：5
2陈凤娟.关联规则的ECLAT算法[J].消费电子,2014(16):149-149. 被引量：3
3张成玉.提高中职学校学生计算机实践能力的方法探究[J].消费电子,2014(16):150-151.
4王萌.基于关系数据库的Apriori改进算法[J].商情,2015,0(12):229-229.
5李宏,康乐,冯佳,李晨晓,张倩倩.碳酸钙矿石晶粒尺寸对其受热后状态的影响[J].重庆大学学报（自然科学版）,2015,38(5):73-77. 被引量：4
6封红旗,沈田予,杨长春.社交网络通信目标检测优化仿真研究[J].计算机仿真,2015,32(12):164-167. 被引量：1
7叶海琴,廖利,王意锋,张爱玲.一种新的频繁模式挖掘算法[J].南京理工大学学报,2016,40(1):29-34. 被引量：2
8魏海平.碳酸钙矿石晶粒尺寸与其受热后状态的关系研究[J].江西建材,2016(5):8-8.
9张春生.大数据环境下相容数据集的关联规则数据挖掘[J].微电子学与计算机,2016,33(8):34-39. 被引量：5
10吴陈,李丹丹.基于粗糙集的关联规则挖掘方法的研究与应用[J].电子测量技术,2016,39(7):44-48. 被引量：6

1贺超波,陈启买.基于粗糙集的关联规则挖掘方法[J].计算机应用,2010,30(1):25-28. 被引量：7
2孙赵旭,谢晓兰,周国清,倪金生,胡莘.基于 Hadoop的Apriori算法与实现[J].桂林理工大学学报,2014,34(3):584-588. 被引量：10
3陈淡泊,仓一倩.基于Hadoop的改进apriori算法应用[J].微型电脑应用,2015,31(10):69-72. 被引量：2
4綦孝姬,于红,刘溪婧,邵乐,梁晓娜.基于候选项目集特性的改进Apriori算法研究[J].郑州大学学报（理学版）,2009,41(1):36-39. 被引量：1
5宋丹.基于粗糙集的手写体数字识别多分类器[J].科学技术与工程,2008,8(10):2711-2713. 被引量：1
6陈燕红,黄名选.基于Apriori改进算法的局部反馈查询扩展[J].现代图书情报技术,2007(9):84-87. 被引量：3
7岳鹏宇,李培仁,袁怀亭,于万荣.关联规则挖掘算法的探讨[J].山西气象,2008(2):34-35.
8程玉,熊英.数据挖掘中关联规则算法的研究[J].软件导刊,2009,8(11):63-65.
9宋凯,王开祥.关联规则在电信业务交叉销售中的应用[J].沈阳理工大学学报,2015,34(4):75-79. 被引量：1
10吕锋华.关系数据库数据挖掘技术具体实现的探讨[J].软件导刊,2009,8(7):150-151.

计算机仿真

2013年第1期

浏览历史

内容加载中请稍等...

基于粗糙集的改进Apriori算法研究被引量：10

参考文献6

同被引文献95

引证文献10

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

基于粗糙集的改进Apriori算法研究 被引量：10

参考文献6

同被引文献95

引证文献10

二级引证文献49

相关作者

相关机构

相关主题

浏览历史

基于粗糙集的改进Apriori算法研究被引量：10