一种不确定数据集上频繁模式挖掘的近似算法被引量：8

Approximation algorithm for frequent itemsets mining on uncertain dataset

下载PDF

导出

摘要为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集进行了算法的测试,分别与目前最好的算法和典型算法进行性能对比。实验结果验证了近似算法AAT-Mine的时空效率都得到了提高。 To improve the efficiency of frequent itemset mining upon uncertain dataset, addressing the issue of heavy computa- tion cost of existing algorithms on judging whether to build sub header table for a certain item in the header table, this paper proposed an approximation algorithm called AAT-Mine, at the cost of losing a small portion of frequent itemsets, improved the overall mining performance. It evaluated the AAT-Mine algorithm using three datasets against classical and state of art algo- rithms. Experimental results show that AAT-Mine not only outperforms AT-Mine, MBP, IMBP, UF-Growth and CUFP-Mine in terms of running time, but also remains efficient memory usage.

作者王水祝孔涛王乐

机构地区宁波大红鹰学院信息工程学院南阳理工学院软件学院大连理工大学电子信息与电气工程学部计算机科学与技术学院

出处《计算机应用研究》 CSCD 北大核心 2014年第3期725-728,共4页 Application Research of Computers

基金国家自然科学基金资助项目(61173163) 宁波市自然科学基金资助项目(2013A610115) 宁波大红鹰学院大宗商品专项项目

关键词数据挖掘频繁模式频繁项集不确定数据集近似算法 vdata mining frequent itemsets frequent pattern uncertain dataset approximation algorithm

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献24

1PRASAD S A, WOLFSON O, CHAMBERLAIN S, et al. Querying the uncertain position of moving objects [ M ]//Temporal Databases : Research and Practice. [ S: 1. ~ :Spring-Verlag,1998:310-337.
2KHOUSSAINOVA N, BALAZINSKA M, SUCIU D. Towards correc- ting input data errors probabilistically using integrity constraints [ C ]//Proc of the 5th ACM International Workshop on Data Enginee- ring for Wireless and Mobile Access. 2006:43-50.
3L~[N Chun-wei, HONG T P. A new mining approach for uncertain da- tabases using CUFP trees [ J]. Expert Systems with Applications, 2012,39(4) :4084-4093.
4AGGARWAL C C, YU P S. A survey of uncertain data algorithms and applications[ J]. IEEE Trans on Knowledge and Data Engi- neering ,2009,21 ( 5 ) :609-623.
5LEUNG C K, MATEO M A F, BRAJCZUK D A. A tree-based ap- proach for frequent pattern mining from uncertain data [ C ]//Proc of the 12th Pacific-Asia Conference on Knowledge Discovery and Data Mining. [ S. 1. ] : Springer-Verlag,2008:653-661.
6SUN Xiao-ying, LIM Li-ming, WANG Shui. An approximation algo- rithm of mining frequent itemsets from uncertain dataset [ J 1. Interna- tional Journal of Advancements in Computing Technology, 2012,4(3 ) :42-49. i.
7CALDERS T, GARBON1 C, .GOETHALS B. Approximation of fre-quentness probability of itemsets in uncertain data[ C ]//Proc of IEEE International Conference on Data Mining. Washington DC : IEEE Com- puter Society,2010:749-754.
8WANG Liang, CHEUNG D W L, CHENG R, et al. Efficient mining of frequent itemsets on large uncertain databases [ .1 ~. IEEE Trans on Knowledge and Data Engineering,2011,24 ( 12 ) :2170-2183.
9LEUNG C K S, CARMICHAEL C L, HAO Bo-yu. Efficient mining of frequent patterns from uncertain data [ C ]//Proc of IEEE Interna- tional Conference on Data Mining Workshops. Washington DC:IEEE Computer Society,2007:489- 494.
10ZHANG Qin, LI Fei-fei, YI Ke. Finding frequent items in probabilis- tic data [ C ]//Proe of ACM SIGMOD International Conferenee on Management of Data. New York : ACM Press,2008 : 819- 832.

二级参考文献24

1李建中于戈周傲英.不确定性数据管理的要求与挑战[J].中国计算机学会通讯,2009,5(4):6-14.
2Aggarwal C C, Yu P S. A framework for clustering uncertain data streams [C] //Proc of the 24th Int Conf on Data Engineering. Los Alamitos, CA: IEEE Computer Society, 2008, 150-159.
3Aggarwal C C. On high dimension projected clustering of uncertain data streams [C] //Proc of the 25th Int Conf on Data Engineering. Los Alamitos, CA: IEEE Computer Society, 2009:1152-1154.
4Zhang Chen, Gao Ming, Zhou Aoying. Tracking high quality clusters over uncertain data streams [C] //Proc of the 1st Workshop on Management and Mining of Uncertain Data (MOUND 2009) Joint with ICDE 2009. Los Alamitos, CA: IEEE Computer Society, 2009 1641-1648.
5Chui C K, Kao B, Hung E. Mining frequent itemsets from uncertain data[G] // LNAI 4426. Berlin: Springer, 2007: 47-58.
6Chui C K, Kao B. A deeremental approach for mining frequent itemsets from uncertain data [G] // LNCS 5012. Berlin: Springer, 2008:64-75.
7Leung C K S, Mateo M A F, Brajczuk D A. A tree-based approach for frequent pattern mining from uncertain data [G] // LNCS 5012. Berlin.. Springer, 2008.. 653-661.
8Leung C K S, Carmichael C L, Hao B. Efficient mining of frequent patterns from uncertain data [G] // LNAI 4426. Berlin: Springer, 2007:489-494.
9Leung C K S, Brajezuk D A. Efficient algorithms for mining constrained frequent patterns from uncertain data [C ]/Proc of SIGKDD Workshop on Knowledge Discovery from Uncertain Data. New York: ACM, 2009:9-18.
10Han Jiawei, Pei Jian, Yin Yiwen. Mining requent patterns without candidate generation [C] //Proc of ACM Int Conf of Management of Data. New York: ACM, 2000 1-12.

共引文献21

1丘晓平,黄小兵.非确定性数据处理技术发展现状与挑战[J].现代计算机,2012,18(18):9-14.
2王爽,王国仁.面向不确定感知数据的频繁项查询算法[J].计算机学报,2013,36(3):571-581. 被引量：8
3阿不都艾尼.阿不都肉素力.复杂网络节点频繁上下线高动态不定行为预测[J].科技通报,2014,30(8):125-127. 被引量：1
4唐晓东.基于关联规则映射的生物信息网络多维数据挖掘算法[J].计算机应用研究,2015,32(6):1614-1616. 被引量：33
5王乐,常艳芬,王水.基于模式增长的不确定数据的频繁模式挖掘算法[J].计算机应用,2015,35(7):1921-1926. 被引量：7
6韩萌,王志海,原继东.基于高斯函数的衰减因子设置方法研究[J].计算机研究与发展,2015,52(12):2834-2843. 被引量：4
7刘慧婷,周开申,赵鹏.基于滑动窗口的不确定性数据流频繁项集挖掘算法[J].计算机应用与软件,2015,32(12):12-15. 被引量：6
8雷宁.基于数字移相的时间间隔测量网络时间统一优化[J].信息通信,2016,0(1):117-118.
9董亚楠,刘学军,李斌,章玮.点击欺诈群体检测与发现[J].计算机应用研究,2016,33(6):1771-1774. 被引量：2
10梁珺,刘云.基于析取规则对不确定数据挖掘的优化研究[J].四川大学学报（自然科学版）,2016,53(4):788-792. 被引量：5

同被引文献48

1刘殷雷,刘玉葆,陈程.不确定性数据流上频繁项集挖掘的有效算法[J].计算机研究与发展,2011,48(S3):1-7. 被引量：14
2CHUI C-K, KAO B, HUNG E. Mining frequent itemsets from uncertain data [C] // PAKDD 2007: Proceedings of the 11th Pacific-Asia Conference on Knowledge Discovery and Data Mining, LNCS 4426. Berlin: Springer, 2007: 47-58.
3WANG L, CHEUNG D W, CHENG R, et al. Efficient mining of frequent itemsets on large uncertain databases [J]. IEEE Transactions on Knowledge and Data Engineering, 2012, 24(12): 2170-2183.
4SUN X, LIM L, WANG S. An approximation algorithm of mining frequent itemsets from uncertain dataset [J]. International Journal of Advancements in Computing Technology, 2012, 4(3): 42-49.
5LEUNG C K, CARMICHAEL C L, HAO B. Efficient mining of frequent patterns from uncertain data [C] // ICDM Workshops 2007: Proceedings of the Seventh IEEE International Conference on Data Mining Workshops. Piscataway: IEEE, 2007: 489-494.
6LEUNG C K, MATEO M A F, BRAJCZUK D A. A tree-based approach for frequent pattern mining from uncertain data [C] // PAKDD 2008: Proceedings of the 12th Pacific-Asia Conference on Advances in Knowledge Discovery and Data Mining, LNCS 5012. Berlin: Springer, 2008: 653-661.
7AGGARWAL C C, LI Y, WANG J, et al. Frequent pattern mining with uncertain data [C] // KDD 2009: Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2009: 29-37.
8PEI J, HAN J, LU H, et al. H-mine: Hyper-structure mining of frequent patterns in large databases [C]// ICDM 2001: Proceedings of the 2001 IEEE International Conference on Data Mining. Piscataway: IEEE, 2001: 441-448.
9LIN C W, HONG T P. A new mining approach for uncertain databases using CUFP trees [J]. Expert Systems with Applications, 2012, 39(4): 4084-4093.
10LEUNG C K, TANBEER S K. Fast tree-based mining of frequent itemsets from uncertain data [C]// DASFAA 2012: Proceedings of the 17th International Conference on Database Systems for Advanced Applications, LNCS 7238. Berlin: Springer, 2012: 272-287.

引证文献8

1王乐,常艳芬,王水.基于模式增长的不确定数据的频繁模式挖掘算法[J].计算机应用,2015,35(7):1921-1926. 被引量：7
2刘芝怡,常睿.基于矩阵的不确定数据频繁项集快速挖掘算法[J].南京理工大学学报,2015,39(4):420-425. 被引量：5
3蒋锐.基于PCA-LBP算法的竞技赛技术动作行为识别模型[J].科技通报,2016,32(6):162-165. 被引量：4
4梁珺,刘云.基于析取规则对不确定数据挖掘的优化研究[J].四川大学学报（自然科学版）,2016,53(4):788-792. 被引量：5
5吴倩,王林平,罗相洲,崔建群.动态数据库中增量Top-k高效用模式挖掘算法[J].计算机应用研究,2017,34(5):1401-1405. 被引量：6
6陈凤娟.概率代表频繁模式挖掘[J].牡丹江师范学院学报（自然科学版）,2017,43(2):19-22.
7茹蓓,贺新征.减少候选项集的数据流高效用项集挖掘算法[J].计算机应用研究,2017,34(11):3379-3383. 被引量：3
8李峰.基于极小数据结构的不确定频繁模式挖掘算法的研究[J].湖南工程学院学报（自然科学版）,2019,29(2):36-39.

二级引证文献30

1叶海琴,廖利,王意锋,张爱玲.一种新的频繁模式挖掘算法[J].南京理工大学学报,2016,40(1):29-34. 被引量：2
2刘云,向婵.基于虚构理论对不平衡数据集中少数类关联规则挖掘的研究[J].云南大学学报（自然科学版）,2017,39(1):33-38. 被引量：9
3陈凤娟.基于概率模型的概率频繁项集挖掘方法[J].安阳师范学院学报,2017(2):57-60.
4张志宏,何海江,刘华富.由分类算法学习软件错误定位的关联测度[J].四川大学学报（自然科学版）,2017,54(4):728-734. 被引量：2
5陈凤娟.概率代表频繁模式挖掘[J].牡丹江师范学院学报（自然科学版）,2017,43(2):19-22.
6李海涛.武术跳跃动作落地速度对着地稳定性校正[J].计算机仿真,2017,34(8):293-296.
7茹蓓,贺新征.减少候选项集的数据流高效用项集挖掘算法[J].计算机应用研究,2017,34(11):3379-3383. 被引量：3
8茹蓓,贺新征.高效的数据流完全频繁项集挖掘算法[J].计算机工程与设计,2017,38(10):2759-2766. 被引量：11
9刘云,黄亚飞.扩展算法在频繁行为模式分析中的优化研究[J].云南大学学报（自然科学版）,2018,40(2):236-242. 被引量：1
10陈凤娟.元组级不确定数据的最大概率频繁项集挖掘研究[J].信息与电脑,2018,30(20):1-2.

1陈凤娟.不确定数据集的模式挖掘[J].商丘师范学院学报,2015,31(12):16-19.
2郑寇全,雷英杰,王睿,王毅.基于确定性转换的IFTS预测[J].应用科学学报,2013,31(2):204-211. 被引量：6
3赵相国,毕鑫,张祯,喻鑫.基于抽样方法的不确定极限学习机[J].东北大学学报（自然科学版）,2015,36(11):1539-1542.
4王意洁,李小勇,杨永滔,祁亚斐,王广东.不确定Skyline查询技术研究[J].计算机研究与发展,2012,49(10):2045-2053. 被引量：5
5郑继刚,杨春华,曾庆红,赵若男.基于Weka平台的不确定数据挖掘[J].保山学院学报,2010,29(5):58-61. 被引量：3
6陈凤娟.不确定数据中的代表频繁项集近似挖掘[J].计算机与数字工程,2017,45(2):266-271. 被引量：1
7姜元凯,郑洪源,丁秋林.一种基于密度的不确定数据离群点检测算法[J].计算机科学,2015,42(4):172-176. 被引量：2
8陆亿红,夏聪.不确定数据的最优k近邻和局部密度聚类算法[J].控制与决策,2016,31(3):541-546. 被引量：14
9刘文远,杜颖,陈子军.不确定数据上范围受限的最近邻查询算法[J].小型微型计算机系统,2012,33(6):1189-1194. 被引量：4
10金石机器人倾力打造智能化无人工厂[J].汽车工艺师,2017,0(5):24-24.

计算机应用研究

2014年第3期

浏览历史

内容加载中请稍等...

一种不确定数据集上频繁模式挖掘的近似算法被引量：8

参考文献24

二级参考文献24

共引文献21

同被引文献48

引证文献8

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

一种不确定数据集上频繁模式挖掘的近似算法 被引量：8

参考文献24

二级参考文献24

共引文献21

同被引文献48

引证文献8

二级引证文献30

相关作者

相关机构

相关主题

浏览历史

一种不确定数据集上频繁模式挖掘的近似算法被引量：8