基于向量的频繁项集挖掘算法研究被引量：7

Research of a frequent itemsets mining algorithm based on vector

导出

摘要针对Apriori算法寻找频繁项集时,需要多次扫描事务数据库和可能产生大量候选项集的问题,提出了一种向量和数组相结合的频繁项集挖掘算法。该算法不仅实现了只扫描事务数据库一次,而且避免了模式匹配,减少了无价值的候选项集的产生。通过与已有算法的比较,验证了本文算法具有较高的挖掘效率,而且数据库的项数越多,此算法的挖掘效果越明显。 To solve the problem that a large number of candidate sets will be generated when an apriori algorithm is used to scan the transaction database many times to look for frequent itemsets,a frequent itemsets mining algorithm is presented based on the combination of vector and array,which can scan the transaction database only once,avoid pattern matching and reduce the generation of worthless candidate sets.In addition,by comparison with the existing algorithms,this algorithm is verified with a high efficiency of mining.And the more items in the database the more effective it is.

作者张文东尹金焕贾晓飞黄超苑衍梅

机构地区中国石油大学(华东)计算机与通信工程学院中海石油(中国)有限公司天津分公司渤海油田勘探开发研究院

出处《山东大学学报（理学版）》 CAS CSCD 北大核心 2011年第3期31-34,共4页 Journal of Shandong University(Natural Science)

关键词数据挖掘关联规则 APRIORI算法频繁项集 data mining association rules apriori algorithm frequent itemsets

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献6

1AGRAWAL R, IMIELINSKE T, SWAMI A. Mining as- sociation rules between sets of items in large databases [ C ]// Proceeding of the ACM SICMOD Conference on Management of Data. New York: ACM Press, 1993: 207-216.
2杜跃,王治和,景永霞.基于数组的关联规则挖掘算法[J].甘肃联合大学学报（自然科学版）,2007,21(3):56-57. 被引量：1
3张文东,刘新恩.一种基于向量的关联规则挖掘算法改进[J].微计算机应用,2009,30(2):73-76. 被引量：2
4张忠平,李岩,杨静.基于矩阵的频繁项集挖掘算法[J].计算机工程,2009,35(1):84-86. 被引量：19
5Han Jiawei，Kamber M.数据挖掘:概念与技术[M]．北京:机械工业出版社，2001．
6王柏盛,刘寒冰,靳书和,马丽艳.基于矩阵的关联规则挖掘算法[J].微计算机信息,2007,23(05X):144-145. 被引量：18

二级参考文献20

1万仁霞,陈瑞典.一种改进的Apriori算法[J].福州大学学报（自然科学版）,2005,33(2):282-284. 被引量：4
2刘莹,郭福亮.基于数组的关联规则挖掘算法[J].计算机与数字工程,2006,34(1):38-40. 被引量：8
3杨健兵.数据挖掘中关联规则的改进算法及其实现[J].微计算机信息,2006(07X):195-197. 被引量：26
4陈刚,李秀,刘文煌.基于“新颖度”的关联挖掘算法[J].微计算机信息,2006,22(08X):1-3. 被引量：4
5焦学磊,王新庄.基于矩阵的频繁项集发现算法[J].江汉大学学报（自然科学版）,2007,35(1):43-46. 被引量：6
6Agrawal R, Imielinski T, Swami A. Mining Association Rules Between Sets of Items in Large Databases[C]//Proc. of ACMSIGMOD Int'l Conf. on Management of Data. Washington D. C., USA: [s. n.], 1993.
7Han Jiawei, Pei Jian, Yin Yiwei. Mining Frequent Patterns Without Candidate Generation[C]//Proc. of the 2000 ACM-SIGMOD Int'l Conf. on Management of Data. Dallas, TX, USA: [s. n.], 2000.
8Wu Fan. A New Approach to Mine Frequent Patterns Using Item-transformation Methods[J]. Information Systems, 2007, 32(7): 1056-1072.
9Aarawal R, Imielinski T, Swami A. Mining association rules between sets of items in large databases. In : Proc. of theACM SIGMOD Int'l Conf. on Management DATA. New York:ACM Press,1993. 207 -216
10Jiawei Han, Micheline Kamber. Data Mining Comcepts and Techniques. 2006.

共引文献72

1丁顺利,洪允德,袁静波.基于单因素方差分析的决策树算法[J].计算机工程与科学,2007,29(10):50-53. 被引量：1
2张涛,丁二玉,骆斌.一种应用于推荐系统的Web挖掘算法：AIR算法[J].计算机工程与应用,2008,44(1):168-170. 被引量：1
3曹忠升,薛梅艳.基于决策树的软件分类方法[J].计算机工程,2008,34(1):56-58. 被引量：6
4卢雪燕,王勇,周永权.一种基于位矩阵的负关联规则挖掘新算法[J].广西民族大学学报（自然科学版）,2007,13(4):57-60. 被引量：3
5李卫华,刘卫国.一种基于压缩矩阵的Apriori改进算法[J].计算机系统应用,2008,17(3):27-30. 被引量：9
6唐亮,杜军平.关联规则挖掘在旅游突发事件预测中的研究[J].北京工商大学学报（自然科学版）,2008,26(1):59-62. 被引量：3
7孙笑微.数据分类技术在高校人才识别系统中的应用[J].沈阳师范大学学报（自然科学版）,2008,26(2):133-136. 被引量：6
8袁万莲,郑诚,翟明清.一种改进的Apriori算法[J].计算机技术与发展,2008,18(5):51-53. 被引量：19
9李勃,王艳兵,姚青.基于粗糙集分类算法研究与实现[J].计算机工程与应用,2008,44(15):142-144. 被引量：5
10刘合兵,尚俊平.基于距离和密度的聚类和孤立点检测算法[J].河南师范大学学报（自然科学版）,2008,36(3):38-40. 被引量：3

同被引文献48

1牛小飞,石冰,卢军,吴科.挖掘关联规则的高效ABM算法[J].计算机工程,2004,30(11):118-120. 被引量：16
2黄龙军,段隆振,章志明.一种基于上三角项集矩阵的频繁项集挖掘算法[J].计算机应用研究,2006,23(11):25-26. 被引量：11
3王柏盛,刘寒冰,靳书和,马丽艳.基于矩阵的关联规则挖掘算法[J].微计算机信息,2007,23(05X):144-145. 被引量：18
4Zhang Zhao-hui, Lu Yu-chang. An effective partitioning-combining algorithm for discovering quantitative association rules [ C ]. Proceedings of PAKDD, Singapore: World Scientific Publishing Co, 2008:241 - 251.
5Cheung D. Efficient mining of association rules in distributed databases[J]. IEEE Transactions on Knowledge and Data Engineering, 2006,8(6) :911 -922.
6Lin D, Kedem Z M. Pincer-search A new algorithm for discovering the maximum frequent set[C]. Proceedings of the 6th International Conference on Extending Database Technology, 2008:105 -119.
7Grahne G, Zhu J F. Fast algorithm for frequent itemset mining using FP-trees [J]. IEEE Trans on Knowledge and Data Engi- neering, 2005, 17 (10): 1347-1362.
8Wu Fan. A new approach to mine frequent patterns using item transformation methods [J]. Information Systems, 2007, 32 (7) : 1056-1072.
9Yu Wangiun, Wang Xiaochun, Wang Fangyi, et al. The re- search of improved apriori algorithm for mining association rules [C] //llth IEEE International Conference on Communication Technology Proceedings, 2008: 513-516.
10WEI Yongqing, YANG Renhua, LIU Peiyu. An improved apriori algorithm for association rules of mining [C] //Proc of IEEE International Symposium on IT in Medicine ~ Educa- tion. Beijing: IEEE Press, 2009: 942-946.

引证文献7

1王红艳,吴代文.数值属性关联规则的挖掘算法[J].信息技术,2012,36(1):20-24.
2张敏,姚良威,侯宇.基于向量和矩阵的频繁项集挖掘算法研究[J].计算机工程与设计,2013,34(3):939-943. 被引量：7
3吴学雁,莫赞.基于Aproiri算法的频繁项集挖掘优化方法[J].计算机系统应用,2014,23(6):124-129. 被引量：8
4刘芳,吴广潮.一种基于压缩矩阵的改进Apriori算法[J].山东大学学报（工学版）,2018,48(6):82-88. 被引量：9
5崔双弥,张德生.一种改进的Inter-Apriori算法[J].计算机系统应用,2017,26(1):157-162. 被引量：2
6陈衡,刘玉文.基于二维数组和十字链表的Apriori算法[J].德州学院学报,2017,33(2):63-67. 被引量：1
7王杰,乐红兵.一种高效的改进频繁项集挖掘算法[J].微电子学与计算机,2018,35(2):49-51. 被引量：5

二级引证文献32

1刘春贵,赵筱蓉.PLC控制在高压系统中的应用[J].四川冶金,2000,22(2):57-59.
2吴学雁,莫赞.基于Aproiri算法的频繁项集挖掘优化方法[J].计算机系统应用,2014,23(6):124-129. 被引量：8
3陈凤娟.关联规则的ECLAT算法[J].消费电子,2014(16):149-149. 被引量：3
4张成玉.提高中职学校学生计算机实践能力的方法探究[J].消费电子,2014(16):150-151.
5陈凤娟.基于数据流的频繁闭项集挖掘[J].电子商务,2014,15(11):68-69.
6周国军,龚榆桐.基于MapReduce和矩阵的频繁项集挖掘算法[J].微电子学与计算机,2016,33(5):119-123. 被引量：7
7吴陈,李丹丹.基于粗糙集的关联规则挖掘方法的研究与应用[J].电子测量技术,2016,39(7):44-48. 被引量：6
8李海生,李春青,梁婷婷,王高才.两阶段高期望权重项集下闭合类Apriori挖掘算法[J].计算机工程与设计,2016,37(10):2738-2743. 被引量：2
9张永梅,许静,郭莎.基于堆排序的重要关联规则挖掘算法研究[J].计算机技术与发展,2016,26(12):45-48. 被引量：2
10边根庆,王月.一种基于矩阵和权重改进的Apriori算法[J].微电子学与计算机,2017,34(1):136-140. 被引量：23

1黄金晶,叶施仁,何福男.基于MapReduce的频繁项集挖掘算法研究[J].物流技术,2015,34(8):178-181. 被引量：3
2陈凤娟.基于MapReduce的关联规则挖掘[J].电脑与电信,2014(8):59-60.
3王伟,高亮,吴涛.基于遗传算法的长频繁项集挖掘方法[J].计算机技术与发展,2008,18(4):19-21. 被引量：2
4廖勇.基于差分隐私的频繁项集挖掘研究综述[J].电子技术与软件工程,2016(3):197-198.
5孙莉.数据库和数据流频繁项集挖掘算法研究[J].现代机械,2007(5):54-57.
6戎翔,李玲娟.基于MapReduce的频繁项集挖掘方法[J].西安邮电学院学报,2011,16(4):37-39. 被引量：24
7陈凤娟.基于图形处理器的频繁项集挖掘[J].软件工程师,2014(9):8-9.
8潘雷.优化关联规则算法的方法研究[J].南京晓庄学院学报,2005,21(5):71-76. 被引量：1
9江雨燕,李平.基于PFP-Growth算法的海量频繁项集挖掘[J].计算机技术与发展,2013,23(9):63-65. 被引量：2
10陈明洁.分布式频繁项集挖掘算法[J].计算机应用与软件,2015,32(10):63-66. 被引量：4

山东大学学报（理学版）

2011年第3期

浏览历史

内容加载中请稍等...

基于向量的频繁项集挖掘算法研究被引量：7

参考文献6

二级参考文献20

共引文献72

同被引文献48

引证文献7

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于向量的频繁项集挖掘算法研究 被引量：7

参考文献6

二级参考文献20

共引文献72

同被引文献48

引证文献7

二级引证文献32

相关作者

相关机构

相关主题

浏览历史

基于向量的频繁项集挖掘算法研究被引量：7