快速关联规则挖掘算法被引量：15

A Fast Algorithm for Mining of Association Rules

下载PDF

导出

摘要关联规则挖掘是数据挖掘及知识发现领域的重要研究内容之一,其核心任务是挖掘数据库中的频繁项集。Apriori及其改良算法是频繁项集挖掘的有效算法。在类Apriori的算法中,它们都采用哈希树来存储频繁项集的候补项集以便快速计算其支持度。该文在仔细分析这些算法所存在的效率瓶颈的基础上,提出了另一个有效的改进算法。所提算法通过利用一个一维数组替代已有算法中的复杂的哈希树来达到改善它们效率瓶颈的目的。通过多个实验评估,该文所提算法的挖掘效率很高,比Apriori及其改良算法要快2到5倍。 Mining of association rules is considered to be on e of the most important data mining tasks.Frequent itemset mining plays an esse ntial role in mining association rules.A lot of previous studies adopt an Apri ori-like approach,in which hash-tree is used to store candidate itemsets base d on analyzing the bottleneck of performance for Apriori-like algorithm,an eff icient algorithm for faster mining of frequent itemsets is proposed in this pa per.It adopts one-dimension array instead of the complex hash-tree structure to expedite the mining process.The several experiments assess the relative perf ormance of the algorithm in comparison with the Apriori and its extended algorit hm.The experiment evaluation shows that the algorithm is faster than both alg orithms by a factor from two to five.

作者杜孝平马秀莉唐世渭牧之内显文

机构地区北京大学视觉与听觉信息处理国家重点实验室北京大学信息科学中心北京大学计算机科学技术系日本九州大学大学院系统情报科学研究院

出处《计算机工程与应用》 CSCD 北大核心 2002年第11期1-4,47,共5页 Computer Engineering and Applications

基金国家973重点基础研究发展规划项目(编号:G1999032705) 留学回国人员科研启动基金资助

关键词频繁项集关联规则算法数据挖掘数据库知识发现 Frequent Itemset,Associatio n Rule,Algorithm,Data Mining,Database

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1[1]C C Aggarwal,P S Yu. Mining Large Itemsets for Association Rules[J].Data Engineering Bulletin, 1998 ;21 ( 1 ) :23～31
2[2]Eui-Hong Han,George Karypis,Vipin Kumar. Scalable Parallel Data Mining for Association Rules[J],IEEE Transactions on Knowledge and Data Engineering,2000; 12(3) :377～352
3[3]R Agrawal,S Srikant.Fast Algorithms for Mining Association Rules[C].Proc.20th Int Conf on VLDB,Santiago,Chile,1994:487～499
4[4]J S Park,M S Chen,P S Yu. An Effective Hash-Based Algorithm for Mining Association Rules[C].Proc ACM SIGMOD Int Conf Management of Data,San Jose,CA, 1995:175～186
5[5]J Liu,J Yin. Towards Efficient Data Re-mining(DRM)[C].Proc PAKDD,5th Pacific-Asia Conf. Hong Kong,China,2001:406～412
6[6]S D Lee,D W Cheung,B Kao.Is Sampling Useful in Data Mining?A Case in the Maintenance of Discovered Association Rules[J].Data Mining and Knowledge Discovery,Kluwer Academic Publishers,1998;2 (3): 233～262

同被引文献79

1吴绍函,余昭平.数据挖掘中关联规则的研究[J].微计算机信息,2008,24(3):185-186. 被引量：15
2修磊,杨社堂.高校排课管理系统的设计与实现[J].太原理工大学学报,2006,37(S1):75-77. 被引量：8
3周焕银,张永,蔺鹏.一种不产生候选项挖掘频繁项集的新算法[J].计算机工程与应用,2004,40(15):182-185. 被引量：14
4冯鉴,姚敏.基于模糊理论的因特网个性化服务应用[J].计算机应用与软件,2004,21(7):74-76. 被引量：6
5李华君,周海岩.基于项目集知识库的关联规则挖掘与更新的高效算法[J].计算机工程与设计,2004,25(12):2198-2201. 被引量：4
6高俊,施伯乐.快速关联规则挖掘算法研究[J].计算机科学,2005,32(3):200-201. 被引量：10
7赵法信,王国业.数据挖掘中聚类分析算法研究[J].通化师范学院学报,2005,26(2):11-13. 被引量：13
8王杰,张静,张继生,曾子维.数据挖掘中关联规则的研究与论证[J].鞍山科技大学学报,2005,28(2):123-126. 被引量：2
9佟强,周园春,阎保平.关联规则挖掘算法[J].微电子学与计算机,2005,22(6):68-72. 被引量：21
10顾泽元,吕宗宝,刘兴丽.频繁项目集发现算法Apriori的研究[J].黑龙江科技学院学报,2005,15(5):319-322. 被引量：6

引证文献15

1王艳.数据挖掘中关联规则的探讨[J].成都信息工程学院学报,2004,19(2):172-176. 被引量：18
2宋雨,赵建利,王保义.关联规则挖掘中最大频繁集的双向查找算法[J].华北电力大学学报（自然科学版）,2005,32(2):67-70. 被引量：5
3冯兴杰,周谆.Apriori算法的改进[J].计算机工程,2005,31(B07):172-173. 被引量：17
4杨洪涛,李桂君.关联规则在房地产广告媒体选择中的应用[J].计算机工程与应用,2006,42(5):230-232. 被引量：1
5冯洁,陶宏才.典型关联规则挖掘算法的分析与比较[J].计算机技术与发展,2007,17(3):121-124. 被引量：12
6景永霞,王治和,杜跃.一种新的Apriori改进算法[J].长春理工大学学报（自然科学版）,2007,30(2):67-69. 被引量：4
7周凤丽,程黎艳.关联规则算法在Web个性化服务中的研究与应用[J].计算机时代,2008(10):55-57. 被引量：1
8郑文争.增量更新关联规则挖掘算法研究[J].计算机与现代化,2009(2):92-94.
9张沛露,王建军.基于关联规则的Web个性化服务研究[J].广西轻工业,2010,26(11):74-74.
10周凤丽,于海平.改进的关联规则挖掘算法在Web个性化服务中的应用[J].计算机与数字工程,2011,39(5):33-35. 被引量：3

二级引证文献66

1刘庆华,姜桦.基于WEB挖掘的关联推荐算法[J].通信技术,2008,41(5):108-110. 被引量：1
2张寒云,段鹏,丁钦华.比例假设检验在关联规则挖掘中的应用研究[J].云南大学学报（自然科学版）,2009,31(S2):378-381.
3常熟市汽摩配商会成绩喜人[J].中华汽摩配,2005(9):63-63.
4杨海涛,刘胜全.基于分布式数据库的挖掘模型[J].现代计算机,2005,11(11):8-12. 被引量：2
5曾孝文.关联规则数据挖掘与发展趋势研究[J].电脑知识与技术,2005(12):4-5. 被引量：5
6彭慧伶,刘发升.关联规则挖掘与分类规则挖掘的比较研究[J].计算机与现代化,2006(7):56-58. 被引量：6
7彭慧伶,刘发升.关联规则挖掘与分类规则挖掘的区别和联系[J].电子工程师,2006,32(7):52-54. 被引量：1
8史原,鲁汉榕,罗菁,高婷.基于规模约简和多支持度的关联规则挖掘[J].计算机工程与设计,2006,27(21):4105-4107. 被引量：8
9赵春玲,宁红云.Apriori算法的改进及其在物流信息挖掘中的应用[J].天津理工大学学报,2007,23(1):30-33. 被引量：13
10姜红艳.Apriori关联算法在学生成绩中的应用[J].鞍山师范学院学报,2007,9(2):48-50. 被引量：7

1孙广维.关联规则挖掘算法研究及改进[J].吉林建筑工程学院学报,2011,28(6):72-74. 被引量：1
2郭有强,胡学钢.快速关联规则增量式更新算法研究[J].安庆师范学院学报（自然科学版）,2007,13(2):17-20.
3陈一明,李丽萍.XML快速关联规则挖掘算法的研究[J].微计算机信息,2009,25(12):221-222.
4陈雪飞.一种基于决策树的快速关联规则挖掘算法[J].计算机科学,2008,35(7):252-254. 被引量：3
5吴伟平,林馥,贺贵明.一种无冗余的快速关联规则发现算法[J].计算机工程,2003,29(8):90-91. 被引量：7
6张海英,浦磊,潘永湘.一种自适应快速关联规则挖掘算法[J].计算机工程与应用,2005,41(28):160-162. 被引量：1
7张海英,浦磊,潘永湘.一种自适应快速关联规则挖掘算法[J].西安理工大学学报,2004,20(4):404-407. 被引量：2
8张文静,马冬来,么炜.基于改进Apriori算法的决策推导过程[J].河北农业大学学报,2013,36(2):122-124. 被引量：2
9倪志伟,蔡庆生,方瑾.用神经网络来挖掘数据库中的关联规则[J].系统仿真学报,2000,12(6):685-687. 被引量：10
10曹静.基于用户兴趣度的关联规则挖掘算法[J].计算机光盘软件与应用,2012,15(16):170-171.

计算机工程与应用

2002年第11期

浏览历史

内容加载中请稍等...

快速关联规则挖掘算法被引量：15

参考文献6

同被引文献79

引证文献15

二级引证文献66

相关作者

相关机构

相关主题

浏览历史

快速关联规则挖掘算法 被引量：15

参考文献6

同被引文献79

引证文献15

二级引证文献66

相关作者

相关机构

相关主题

浏览历史

快速关联规则挖掘算法被引量：15