基于频繁模式矩阵的最大频繁项目集挖掘算法被引量：7

AN ALGORITHM FOR MINING MAXIMUM FREQUENT ITEMSETS BASED ON FP-ARRAY

下载PDF

导出

摘要提出了一种基于频繁模式矩阵FP-array的挖掘最大频繁项目集的算法。算法基本思想:①只扫描事务数据库一遍,把该数据库转换成一个矩阵FP-array,并且保留了所有事务数据库中项目间的关联信息,然后对该矩阵进行挖掘。②在FP-array中只存放逻辑型数据,节省了存储空间。③直接在FP-array上挖掘而不需要递归创建大量条件模式矩阵,挖掘过程采用逻辑运算,在效率上有独特的优势。通过实验验证了算法的有效性。 A new algorithm for mining maximum frequent itemsets based on FP-array is presented. The main idea of this algorithm is that ① it can convert a transaction database into a FP-array through scanning the database only once. Then it does the mining work of the FP-array that includes all information of items in database. ② FP-array is better in memory because it stores logic data only. ③ There is no need to build conditional arrays in the FP-array mining process. Logic operaion is adopted so that the algorithm has predominance in efficiency. An experiment is carried out to verify the mining effectiveness.

作者李忠哗吴聪聪戴维迪何丕廉

机构地区河北北方学院计算机系天津大学计算机学院石家庄经济学院

出处《计算机应用与软件》 CSCD 北大核心 2007年第7期45-46,53,共3页 Computer Applications and Software

基金天津市科技发展计划资助项目(04310941R) 天津市应用基础研究计划资助项目(05YFJMJC11700) 河北省科技研究与发展指导计划项目(0621355)。

关键词数据挖掘频繁模式矩阵最大频繁项目集算法 Data mining FP-array Maximum frequent itemsets Algorithm

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1陈凯,冯全源.最大频繁项集的高效挖掘[J].微电子学与计算机,2005,22(8):22-25. 被引量：13
2路松峰,卢正鼎.快速开采最大频繁项目集[J].软件学报,2001,12(2):293-297. 被引量：113
3刘乃丽,李玉忱,马磊.一种基于FP-tree的最大频繁项目集挖掘算法[J].计算机应用,2005,25(5):998-1000. 被引量：8

二级参考文献16

1冯志新,钟诚.基于FP-tree的最大频繁模式挖掘算法[J].计算机工程,2004,30(11):123-124. 被引量：18
2Lin Dao I，Proc the 6th European Conference on Extending Database Technology，1998年，105页
3Agrawal R，Proc the 11th Inter Conference on Data Engineering，1995年，3页
4AGRAWA LR, IMIELINSKI T, SWAMI A.Mining association rules between sets of items in large databases[A]. BUNEMAN P, JAJODIA S, ed. Proc. Of the ACM SIGMOD Conf. On Management of Data (SIGMOD'93)[C]. New York: ACM Press, 1993. 207-216.
5AGRAWA LR, SRIKANT R. Fast algorithms for mining association rules in large databases[A]. BOCCA JB, JARKE M, ZANIOLO C, ed. Proc.of the 20th Int'l Conf. On Very Large Data Bases[C]. Santiago: Morgan Kaufmann, 1994. 478-499.
6ALY HH, TAHA Y, AMR AA. Fast mining of association rules in large-scale problems[A]. ABDEL-WAHAB H, JEFFAY K, ed. Proc. of the 6th IEEE Symp. on Computers and Communications (ISCC 2001)[C]. New York: IEEE Computer Society Press, 2001. 107-113.
7TSAI CF, LIN YC, CHEN CP. A new fast algorithms for mining association rules in large databases[A].KAMEL AE, MELLOULI K, BORNE P, ed. Proc. Of the 2002 IEEE Int'l Conf. On Systems, Man and Cybernetics (SMC 2002)[C]. IEEE Computer Society Press, 2002.251-256.
8HAN J, PEI J, YIN Y. Mining frequent patterns without candidate generation[A]. CHEN WD, NAUGHTON J, BERNSTEIN PA, ed. Proc. Of the 2000 ACM SIGMOD Int'l Conf. On Management of Data (SIGMOD 2000)[C]. New York: ACM Press, 2000. 1～12.
9BAYARDO R.Efficiently mining long patterns from databases[A]. HAAS LM, ed. Proceedings of the ACM SIGMOD International Conference on Management of Data[C]. New York: ACM Press, 1998. 85-93.
10LIN DI, KEDEM ZM.Pincer-Search: A new algorithm for discovering the maximum frequent set[A]. SCHEK HJ, ed. Proceedings of the 6th European Conference on Extending Database Technology[C]. Heidelberg: Springer-Verlag, 1998. 105-119.

共引文献124

1谢志强,朱孟杰,杨静.基于改进FP-树的最大项目集挖掘算法[J].计算机应用研究,2009,26(2):502-505. 被引量：1
2姜晗,贾泂.基于标记域FP-Tree快速挖掘最大频繁项集[J].计算机研究与发展,2007,44(z2):334-349. 被引量：4
3陈晴光,李际军.汽车ERP中关联规则挖掘与动态更新的实现策略[J].机械制造,2004,42(6):69-72. 被引量：2
4杨君锐.逆向启发式开采最大频繁项目集[J].计算机工程,2004,30(14):116-118. 被引量：1
5杨君锐,赵群礼.一种不产生候选集的最大频繁集快速挖掘算法[J].微电子学与计算机,2004,21(11):125-128. 被引量：4
6李清峰,杨路明,张晓峰.关联规则中最大频繁项目集的研究[J].计算机应用研究,2005,22(1):93-95. 被引量：3
7吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
8李宏,杜剑峰,陈松乔.分布式数据库约束性关联规则挖掘[J].中南大学学报（自然科学版）,2004,35(6):998-1003. 被引量：1
9钱进.最大频繁项目集挖掘技术研究[J].江苏技术师范学院学报,2004,10(4):61-64.
10颜跃进,李舟军,陈火旺.基于FP-Tree有效挖掘最大频繁项集[J].软件学报,2005,16(2):215-222. 被引量：69

同被引文献45

1吉根林,杨明,宋余庆,孙志挥.最大频繁项目集的快速更新[J].计算机学报,2005,28(1):128-135. 被引量：47
2陈凯,冯全源.最大频繁项集的高效挖掘[J].微电子学与计算机,2005,22(8):22-25. 被引量：13
3秦亮曦,史忠植.关联规则研究综述[J].广西大学学报（自然科学版）,2005,30(4):310-317. 被引量：22
4唐瑜,王勇,杨辉华.挖掘最大频繁项集的优化方法[J].计算机工程与应用,2006,42(31):171-173. 被引量：5
5李超,余昭平.基于矩阵的Apriori算法改进[J].计算机工程,2006,32(23):68-69. 被引量：44
6李忠哗,任春龙,何丕廉.一种基于FP-树的最大频繁模式增量更新挖掘算法[J].计算机应用与软件,2007,24(5):47-49. 被引量：3
7高宏宾,潘谷,黄义明.基于频繁项集特性的Apriori算法的改进[J].计算机工程与设计,2007,28(10):2273-2275. 被引量：25
8胡学钢,刘卫,王德兴.基于剪枝概念格的项集知识表示与挖掘[J].计算机工程与应用,2007,43(22):176-178. 被引量：4
9AGRAWAL R, IMIELINSKI T, SWAMI A. Mining association rules betweensets of items in large databases[C]//IProc of the ACM SIGMOD Conf on Management of Data(SIGMOD '93). New York: ACM Press, 1993: 207-216.
10HAN J, PEI J, YIN Y. Mining frequent pattemswithout candidate genera2tion[C]//Proc of the 2000 ACM SIGMOD Int'l Conf on Management of Data(SIGMOD 2000). New York: ACM Press, 2000: 1-12.

引证文献7

1李献礼,陈业纲.FP-array在计算机犯罪挖掘中的应用[J].电子科技大学学报,2009,38(4):592-595.
2李伟,李先国.基于频繁模式矩阵的改进挖掘算法研究[J].科学技术与工程,2010,10(4):1024-1027. 被引量：1
3茹蓓,赵芳.聚类算法在图书馆中的应用[J].新乡学院学报,2011,28(1):41-43. 被引量：3
4刘敏娴,马强,宁以风.基于频繁矩阵的Apriori算法改进[J].计算机工程与设计,2012,33(11):4235-4239. 被引量：20
5雷伟军.大型复杂设备拆卸三维虚拟仿真模型分析[J].计算机仿真,2016,33(4):415-418. 被引量：1
6刘杰,葛晓玢,姚珺.基于矩阵的最大频繁项目集挖掘算法研究[J].电脑知识与技术（过刊）,2011,17(10X):7234-7236. 被引量：1
7李海舟.浅析网络安全在图书馆管理系统中的实际应用[J].电子制作,2013,21(8X):155-155. 被引量：2

二级引证文献28

1孙中祥,彭湘君,杨玉平,贺一.数据挖掘在教育教学中的应用综述[J].智能计算机与应用,2012,2(1):78-80. 被引量：7
2李默,梁永全,赵建立,李玉军.面向网络视频的组合推荐系统模型研究[J].计算机工程与设计,2013,34(12):4379-4383. 被引量：5
3丁丽.基于Apriori算法的用户行为数据挖掘研究[J].科技通报,2013,29(12):214-217. 被引量：9
4陈方健,张明新,杨昆.布尔矩阵Apriori算法的MapReduce并行化实现[J].常熟理工学院学报,2014,28(2):98-101. 被引量：2
5张冲.Apriori算法在物联网(IOT)数据挖掘中的应用[J].科技通报,2014,30(11):162-164. 被引量：1
6陈艳秋,李海波.一种基于本体的关联规则挖掘方法[J].黑龙江大学自然科学学报,2014,31(6):825-830. 被引量：2
7韦哲,于启炟,辛迈.基于Apriori算法的高危人群2型糖尿病预测研究[J].中国医学装备,2015,12(1):45-47. 被引量：10
8赵文涛,付侃侃,李素青,张霄宏.基于随机相遇的频繁项集挖掘方法[J].河南理工大学学报（自然科学版）,2015,34(1):81-84. 被引量：3
9陈方健,张明新,杨昆.一种具有跳跃式前进的Apriori算法[J].计算机应用与软件,2015,32(3):34-36. 被引量：10
10张卫华.基于矩阵的apriori算法的改进[J].电子设计工程,2015,23(13):52-54. 被引量：6

1李伟,李先国.基于频繁模式矩阵的改进挖掘算法研究[J].科学技术与工程,2010,10(4):1024-1027. 被引量：1
2李忠哗,吴聪聪,何丕廉.一种约束最大频繁项目集挖掘算法[J].微电子学与计算机,2007,24(11):70-72. 被引量：2
3高建山.基于矩阵的最大频繁模式挖掘算法研究[J].科技创新与应用,2011,1(21):41-41.
4刘敏娴,马强,宁以风.基于频繁矩阵的Apriori算法改进[J].计算机工程与设计,2012,33(11):4235-4239. 被引量：20
5冯洁,陶宏才.快速挖掘最大频繁项集[J].微电子学与计算机,2007,24(5):123-126. 被引量：12
6陈凯,冯全源.最大频繁项集的高效挖掘[J].微电子学与计算机,2005,22(8):22-25. 被引量：13
7刘伏贵.面向对象的软件系统抽象和逻辑模型[J].湘潭大学自然科学学报,1996,18(3):113-116. 被引量：2
8邓丰义,刘震宇.基于模式矩阵的FP-growth改进算法[J].厦门大学学报（自然科学版）,2005,44(5):629-633. 被引量：17
9刘江华,戴新喜,白似雪.基于模式矩阵的P_Matrix算法[J].南昌大学学报（理科版）,2007,31(5):496-499. 被引量：4
10刘忠慧,赵正文.基于模式矩阵的Apriori优化算法[J].数字技术与应用,2011,29(1):83-83.

计算机应用与软件

2007年第7期

浏览历史

内容加载中请稍等...

基于频繁模式矩阵的最大频繁项目集挖掘算法被引量：7

参考文献3

二级参考文献16

共引文献124

同被引文献45

引证文献7

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于频繁模式矩阵的最大频繁项目集挖掘算法 被引量：7

参考文献3

二级参考文献16

共引文献124

同被引文献45

引证文献7

二级引证文献28

相关作者

相关机构

相关主题

浏览历史

基于频繁模式矩阵的最大频繁项目集挖掘算法被引量：7