-
题名基于PFP-Growth算法的海量频繁项集挖掘
被引量:2
- 1
-
-
作者
江雨燕
李平
-
机构
安徽工业大学管理科学与工程学院
-
出处
《计算机技术与发展》
2013年第9期63-65,198,共4页
-
基金
安徽高校省级自然科学研究项目(kj2011z039)
安徽工业大学硕士研究生导师创新基金项目(D2011024)
-
文摘
随着互联网技术的发展,网络数据变得越来越巨大,如何从中挖掘有效信息成为人们研究的重点。近年来频繁项集挖掘由于其在关联规则挖掘、相关挖掘等任务中的相关重要作用,越来越受到人们的重视。文中针对分布式计算环境下频繁项集挖掘算法的研究,对PFP-Growth算法进行了改进,通过MapReduce编程模型对改进的PFP-Growth算法进行了实现和应用,使用户可以从海量数据中高效地获得所有需要的频繁项集。实验结果表明算法在针对海量数据时具有较高的效率和伸缩性。
-
关键词
频繁项集
海量数据
PFP-Growth
-
Keywords
frequent itcmset
massive data
PFP-Growth
-
分类号
TP31
[自动化与计算机技术—计算机软件与理论]
-
-
题名大型数据库中关于多频项集的动态增量式挖掘
- 2
-
-
作者
何友全
-
机构
重庆交通学院计算机与信息工程学院
-
出处
《计算机工程》
EI
CAS
CSCD
北大核心
2006年第2期76-78,共3页
-
基金
重庆市科委基金资助项目(CSTC
20056112)
-
文摘
提出了一种针对大型数据库、关于多频项集、动态增量式的挖掘新算法,利用前次的挖掘结果和新增物品项ID的明细数据,能有效地挖掘出频繁项集及各项ID之间的量化比例关系,给商家和物流系统提供信息指导,避免错误决策,对实现物流系统自动化及其它数据挖掘应用领域都具有极其重要的指导意义。
-
关键词
数据挖掘
增最挖掘
多频项集
物流
-
Keywords
Data mining
Growing mining
More frequent itcmset
Commodities interflow
-
分类号
TP311.131
[自动化与计算机技术—计算机软件与理论]
-