基于FP-Tree的最大频繁项目集挖掘及更新算法被引量：164

An Algorithm and Its Updating Algorithm Based on FP-Tree for Mining Maximum Frequent Itemsets

下载PDF

导出

摘要挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. Mining maximum frequent itemsets is a key problem in many data mining application. Most of the previous studies adopt an Apriori-like candidate set generation-and-test approach. However, candidate set generation is still costly, especially when there exist prolific patterns and/or long patterns. In this paper, a fast algorithm DMFIA (discover maximum frequent itemsets algorithm) and its updating algorithm UMFIA (update maximum frequent itemsets algorithm) based on frequent pattern tree (FP-tree) for mining maximum frequent itemsets is proposed. The algorithm UMFIA makes use of previous mining result to cut down the cost of finding new maximum frequent itemsets in an updated database.

作者宋余庆朱玉全孙志挥陈耿

机构地区东南大学计算机科学与工程系

出处《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页 Journal of Software

基金国家自然科学基金国家科技型中小企业技术创新基金~~

关键词数据挖掘最大频繁项目集关联规则频繁模式树增量式更新 data mining maximum frequent itemset association rule frequent pattern tree incremental updating

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献1

1路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113

二级参考文献2

1Lin Dao I，Proc the 6th European Conference on Extending Database Technology，1998年，105页
2Agrawal R，Proc the 11th Inter Conference on Data Engineering，1995年，3页

共引文献112

1谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
2姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(Z2):334-349.
3陈晴光,李际军.汽车ERP中关联规则挖掘与动态更新的实现策略[J].机械制造,2004,42(6):69-72. 被引量：2
4杨君锐.逆向启发式开采最大频繁项目集[J].计算机工程,2004,30(14):116-118. 被引量：1
5杨君锐,赵群礼.一种不产生候选集的最大频繁集快速挖掘算法[J].微电子学与计算机,2004,21(11):125-128. 被引量：4
6李清峰,杨路明,张晓峰.关联规则中最大频繁项目集的研究[J].计算机应用研究,2005,22(1):93-95. 被引量：3
7吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
8李宏,杜剑峰,陈松乔.分布式数据库约束性关联规则挖掘[J].中南大学学报（自然科学版）,2004,35(6):998-1003. 被引量：1
9钱进.最大频繁项目集挖掘技术研究[J].江苏技术师范学院学报,2004,10(4):61-64.
10颜跃进,李舟军,陈火旺.基于FP-Tree有效挖掘最大频繁项集[J].软件学报,2005,16(2):215-222. 被引量：69

同被引文献1067

1任亚洲.频繁项集挖掘算法综述[J].电脑知识与技术（过刊）,2007(16):1066-1068. 被引量：2
2秦亮曦,苏永秀,刘永彬,梁碧珍.基于压缩FP-树和数组技术的频繁模式挖掘算法[J].计算机研究与发展,2008,45(Z1):244-249.
3王丽苹,安娜,吴晓南,房鼎益.入侵检测系统中的行为模式挖掘[J].通信学报,2004,25(7):168-175. 被引量：15
4崔杰,李陶深,兰红星.基于Hadoop的海量数据存储平台设计与开发[J].计算机研究与发展,2012,49(S1):12-18. 被引量：146
5杨霁琳.一种基于概念格的规则提取方法及其应用[J].计算机科学,2012,39(S3):204-206. 被引量：2
6王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
7何友全,肖建,黄碧霞,雷妍,熊启军.一种用于数据挖掘的二进制挖掘算法[J].计算机应用研究,2004,21(5):15-16. 被引量：3
8李力,靳蕃.A New Algorithm for Mining Frequent Pattern[J].Journal of Southwest Jiaotong University(English Edition),2002,10(1):10-20. 被引量：2
9易彤,徐宝文,吴方君.一种基于FP树的挖掘关联规则的增量更新算法[J].计算机学报,2004,27(5):703-710. 被引量：32
10冯志新,钟诚.基于FP-tree的最大频繁模式挖掘算法[J].计算机工程,2004,30(11):123-124. 被引量：18

引证文献164

1谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
2姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(Z2):334-349.
3杨种学.基于并行FP-growth算法挖掘网上关联交易规则[J].南京晓庄学院学报,2005,21(5):65-70.
4王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
5朱玉全,宋余庆,陈耿.约束最大频繁项目集的增量式更新算法[J].计算机工程,2004,30(18):31-32.
6杨君锐,赵群礼.一种不产生候选集的最大频繁集快速挖掘算法[J].微电子学与计算机,2004,21(11):125-128. 被引量：4
7张莹,韩芳溪,柴乔林.基于频繁模式树的AOI聚类算法[J].计算机工程与应用,2004,40(35):178-179.
8李清峰,杨路明,张晓峰.关联规则中最大频繁项目集的研究[J].计算机应用研究,2005,22(1):93-95. 被引量：3
9吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
10陈天敏,姜丽红.基于预制数据库的FP-tree构造算法[J].计算机工程,2004,30(B12):58-61.

二级引证文献526

1廖纪勇,吴晟,刘爱莲.一种基于邻接矩阵的频繁项集挖掘算法[J].数据通信,2020(6):30-34. 被引量：1
2闫伟.水上通信网络海量多维数据弱关联识别方法[J].舰船科学技术,2019,0(20):124-126.
3吴磊,何嘉.基于项目集矩阵的AprioriHybral算法研究[J].成都信息工程学院学报,2009(1):43-47.
4谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
5曲婧佳.JAAS在港口信息化中的应用[J].黑龙江对外经贸,2009(7):75-76.
6徐红艳,陈锋,张森林,冯勇.一种存在全局站点的分布式增量挖掘算法[J].辽宁大学学报（自然科学版）,2013,40(1):41-47.
7王盛,董黎刚,李群.一种基于逆序编码的关联规则挖掘研究[J].杭州电子科技大学学报（自然科学版）,2010,30(5):169-172. 被引量：1
8郝建军,张振刚,闫宁.基于灰色理论的电力负荷预测[J].商情,2008(6):103-104.
9杨洪志.村官申利洲[J].中国大学生就业,2005(12):25-26. 被引量：1
10韦华伟.企业文化培训应如何实施[J].人才资源开发,2005(8):65-66. 被引量：2

1陈向华,刘可昂.基于FP-Tree的最大频繁项目集挖掘算法[J].软件,2015,36(12):98-102. 被引量：6
2钱进.最大频繁项目集挖掘技术研究与展望[J].微计算机应用,2005,26(6):652-654. 被引量：7
3钱进.最大频繁项目集挖掘技术研究[J].江苏技术师范学院学报,2004,10(4):61-64.
4马丽生,邓辉文,齐逸.一种新的最大频繁项目集挖掘算法[J].计算机应用,2006,26(11):2670-2673. 被引量：6
5宋余庆,朱玉全,孙志挥,杨鹤标.一种基于频繁模式树的约束最大频繁项目集挖掘及其更新算法[J].计算机研究与发展,2005,42(5):777-783. 被引量：21
6赵鹏.海量高维数据下的频繁项目集挖掘算法研究[J].计算机应用与软件,2012,29(7):150-153. 被引量：2
7刘杰,葛晓玢,姚珺.基于矩阵的最大频繁项目集挖掘算法研究[J].电脑知识与技术（过刊）,2011,17(10X):7234-7236. 被引量：1
8陈耿,朱玉全,宋余庆,陆介平,孙志挥.基于频繁模式树的约束最大频繁项目集挖掘算法研究[J].应用科学学报,2006,24(1):64-69. 被引量：4
9王绪峰,陶跃华,唐德权,申静,孙玉涛.一种基于FP-tree的最大频繁项目集挖掘算法[J].云南大学学报（自然科学版）,2006,28(S2):97-101.
10马丽生,邓辉文,齐逸.基于FP-tree的最大频繁项目集挖掘算法[J].计算机工程与设计,2008,29(2):385-388. 被引量：4

软件学报

2003年第9期

浏览历史

内容加载中请稍等...

基于FP-Tree的最大频繁项目集挖掘及更新算法被引量：164

参考文献1

二级参考文献2

共引文献112

同被引文献1067

引证文献164

二级引证文献526

相关作者

相关机构

相关主题

浏览历史

基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量：164

参考文献1

二级参考文献2

共引文献112

同被引文献1067

引证文献164

二级引证文献526

相关作者

相关机构

相关主题

浏览历史

基于FP-Tree的最大频繁项目集挖掘及更新算法被引量：164