改进的频繁项集挖掘算法研究被引量：2

Research on advanced frequent itemsets mining algorithm

下载PDF

导出

摘要通过对关联规则挖掘技术及经典算法Apriori和FP-growth的研究和分析,提出了一种改进的频繁项集挖掘算法。该算法利用矩阵存储数据,并结合矩阵运算求项集的支持数,有效减少了事务数据库的扫描次数;利用有序频繁项目邻接矩阵创建频繁模式树,有效减少了频繁模式树的分支和层数。通过实例分析了频繁项集的挖掘过程。 In view of the association rule mining technology and the research and analysis of its classic Apriori algo- rithm and FP-growth algorithm, an advanced frequent itemsets mining algorithm is proposed. The improved algo- rithm stores database using of matrix and calculates itemsets＇ support number in terms of the matrix operation, which reduces the number of times for database scanning. The algorithm creates frequent pattern tree using of orderly frequent item adjacency matrix, which effectively reduces the branch and layer of the tree. Finally the examples ana- lyze the frequent itemsets of mining process.

作者王艳李玲玲邵晓艳

机构地区郑州航空工业管理学院计算机科学与应用系

出处《计算机工程与应用》 CSCD 2012年第19期119-121,144,共4页 Computer Engineering and Applications

基金国家自然科学基金(No.41171341) 教育部新世纪优秀人才支持计划(No.NCET-09-0126) 河南省科技创新杰出青年基金(No.114100510006) 河南省重点科技攻关计划项目(No.112102210024) 航空科学基金(No.2010ZG55029)

关键词数据挖掘关联规则邻接矩阵频繁模式树 data mining association rules adjacency matrix frequent pattern tree

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1Agrawal R,Srikant R.Fast Algorithms for Mining Association Rules[].Proceedings of the th International Conference on Very Large Databases(VLDB’).1994
2范黎林,林卫.矩阵约束下的频繁项集挖掘方法研究[J].计算机工程与应用,2011,47(21):133-136. 被引量：1
3张月琴.基于0-1矩阵的频繁项集挖掘算法研究[J].计算机工程与设计,2009,30(20):4662-4664. 被引量：8
4张忠平,李岩,杨静.基于矩阵的频繁项集挖掘算法[J].计算机工程,2009,35(1):84-86. 被引量：19
5黄刘生,陈华平,王洵,陈国良.A Fast Algorithm for Mining Association Rules[J].Journal of Computer Science & Technology,2000,15(6):619-624. 被引量：18
6刘应东,冷明伟,陈晓云.基于邻接矩阵的FP-tree构造算法[J].计算机工程与应用,2011,47(7):153-155. 被引量：9
7Han Jiawei,Pei Jian,Yin Yiwen.Mining Frequent Patterns without Candidate Generation[].Proc of the ACM SIGMOD International Conference on Management of Data.2000

二级参考文献31

1牛小飞,石冰,卢军,吴科.挖掘关联规则的高效ABM算法[J].计算机工程,2004,30(11):118-120. 被引量：16
2秦亮曦,史忠植.SFPMax——基于排序FP树的最大频繁模式挖掘算法[J].计算机研究与发展,2005,42(2):217-223. 被引量：26
3胡慧蓉,王周敬.一种基于关系矩阵的关联规则快速挖掘算法[J].计算机应用,2005,25(7):1577-1579. 被引量：21
4曾万聃,周绪波,戴勃,常桂然,李春平.关联规则挖掘的矩阵算法[J].计算机工程,2006,32(2):45-47. 被引量：33
5焦学磊,王新庄.基于矩阵的频繁项集发现算法[J].江汉大学学报（自然科学版）,2007,35(1):43-46. 被引量：6
6王黎明,赵辉.基于FP树的全局最大频繁项集挖掘算法[J].计算机研究与发展,2007,44(3):445-451. 被引量：16
7于红,王秀坤,孟军.用有序FP-tree挖掘最大频繁项集[J].控制与决策,2007,22(5):520-524. 被引量：7
8高宏宾,潘谷,黄义明.基于频繁项集特性的Apriori算法的改进[J].计算机工程与设计,2007,28(10):2273-2275. 被引量：25
9李娟,张明义,汪维清.快速挖掘加权频繁项集的矩阵位串算法[J].计算机工程与设计,2007,28(11):2533-2536. 被引量：4
10Agrawal R, Imielinski T, Swami A. Mining Association Rules Between Sets of Items in Large Databases[C]//Proc. of ACMSIGMOD Int'l Conf. on Management of Data. Washington D. C., USA: [s. n.], 1993.

共引文献49

1李娜娜,宋洁,顾军华,郭树军.灾害天气关联模式挖掘技术研究[J].河北工业大学学报,2005,34(2):68-73. 被引量：2
2郭红涛,郭永红,郭朝彬.数据挖掘技术在物流信息系统中的应用[J].科技信息,2009(4):262-263. 被引量：3
3陈超祥,丁健龙,华成,金林樵.基于频繁叶模式的XML最大频繁查询模式挖掘算法[J].计算机应用与软件,2009,26(6):85-87.
4周国涛,金银秋.基于关联规则挖掘的Web用户分类研究[J].中原工学院学报,2009,20(3):51-55. 被引量：2
5宋旭东,杨莉国,刘晓冰,闫晓岚,赵彦军.基于UML Profile的关联规则挖掘元模型研究[J].计算机应用研究,2010,27(1):68-70.
6刘应东,冷明伟,陈晓云.基于链表数组的最大频繁项集挖掘算法[J].计算机工程,2010,36(6):89-90. 被引量：4
7张笑达,徐立臻.一种改进的基于矩阵的频繁项集挖掘算法[J].计算机技术与发展,2010,20(4):93-96. 被引量：8
8侯新丽,孟晓伟,于松.基于矩阵的加权关联规则挖掘算法[J].电脑开发与应用,2010,23(6):34-36. 被引量：4
9朱颢东,李红婵.关于Top-N最频繁项集挖掘的研究[J].电子科技大学学报,2010,39(5):757-761.
10王玉荣,钱雪忠.基于客户机/服务器模式并行关联规则的研究与实现[J].计算机工程与设计,2010,31(22):4827-4830. 被引量：1

同被引文献15

1张石磊,武装.一种基于Hadoop云计算平台的聚类算法优化的研究[J].计算机科学,2012,39(S2):115-118. 被引量：29
2王创新.关联规则提取中对Apriori算法的一种改进[J].计算机工程与应用,2004,40(34):183-185. 被引量：32
3Agrawal R,Srikant R. Fast Algorithms for mining Association Rules [ C ]/// Proceedings of the Twentieth International Conference on fi- ery Large Databases, Santiago, Chile, 1994:487 - 499.
4熊忠阳,陈培恩,张玉芳.基于散列布尔矩阵的关联规则Eclat改进算法[J].计算机应用研究,2010,27(4):1323-1325. 被引量：18
5成平广,韦鹏程.一种改进的关联规则挖掘算法在高校招生录取中的应用研究[J].微电子学与计算机,2010,27(5):189-192. 被引量：2
6王艳,薛海燕,李玲玲,孙新德.一种改进的加权频繁项集挖掘算法[J].计算机工程与应用,2010,46(23):135-137. 被引量：3
7张云涛,于治楼,张化祥.关联规则中频繁项集高效挖掘的研究[J].计算机工程与应用,2011,47(3):139-141. 被引量：18
8林佳雄,黄战.基于数组向量的Apriori算法改进[J].计算机应用与软件,2011,28(5):268-271. 被引量：14
9刘步中.基于频繁项集挖掘算法的改进与研究[J].计算机应用研究,2012,29(2):475-477. 被引量：31
10李玉林,董晶.基于Hadoop的MapReduce模型的研究与改进[J].计算机工程与设计,2012,33(8):3110-3116. 被引量：36

引证文献2

1许普乐,纪允,张勤.应用FP树快速生成无关集算法[J].安庆师范学院学报（自然科学版）,2016,22(2):60-65. 被引量：1
2丁洁.基于云平台的矩阵式Apriori改进算法[J].信息技术,2015,39(9):162-165. 被引量：2

二级引证文献3

1刘毓,李莎.一种基于权重的Apriori改进算法[J].西安邮电大学学报,2017,22(4):95-100. 被引量：4
2许普乐,纪允.一种基于Rymon枚举树的快速挖掘无关集算法[J].轻工学报,2017,32(5):103-108.
3章亚东,胡孔法,杨涛.基于Apriori改进算法的名老中医肺癌医案用药规律研究[J].辽宁中医杂志,2019,46(7):1372-1375. 被引量：7

1胡蓉,陈文.一种基于串与运算的关联规则挖掘算法[J].东北电力学院学报,2005,25(2):12-15.
2王燕.基于等价关系的关联规则挖掘算法研究[J].计算机工程与应用,2006,42(8):187-189. 被引量：5
3陈旭辉,蒋红.基于双向搜索的最大频繁项目集挖掘算法[J].计算机工程与设计,2007,28(14):3288-3290. 被引量：2
4尹士闪,马增强,毛晚堆.基于频繁项目集链式存储方法的关联规则算法[J].计算机工程与设计,2012,33(3):1002-1007. 被引量：4
5郑海明.基于FP-tree最大频繁项集的FP-MFI算法研究[J].现代计算机,2008,14(10):37-39. 被引量：1
6吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
7张永梅,许静,郭莎.基于堆排序的重要关联规则挖掘算法研究[J].计算机技术与发展,2016,26(12):45-48. 被引量：2
8毛伊敏,李宏,杨路明,刘立新.基于滑动窗口的数据流最大频繁项集的挖掘[J].高技术通讯,2010,20(11):1142-1148.
9梅俊,郑刚.一种基于FP-tree的最大频繁项目集挖掘算法[J].现代计算机,2009,15(9):33-36. 被引量：1
10王国光,刘铁英,王鑫.基于空间划分的频繁模式挖掘算法[J].内蒙古大学学报（自然科学版）,2007,38(3):330-336.

计算机工程与应用

2012年第19期

浏览历史

内容加载中请稍等...

改进的频繁项集挖掘算法研究被引量：2

参考文献7

二级参考文献31

共引文献49

同被引文献15

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

改进的频繁项集挖掘算法研究 被引量：2

参考文献7

二级参考文献31

共引文献49

同被引文献15

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

改进的频繁项集挖掘算法研究被引量：2