-
题名基于改进的FP-tree最大频繁模式挖掘算法
被引量:4
- 1
-
-
作者
宁慧
王素红
崔立刚
郭笑语
徐丽
-
机构
哈尔滨工程大学计算机科学与技术学院
-
出处
《应用科技》
CAS
2016年第2期37-43,共7页
-
基金
国家自然科学基金项目(61201084)
-
文摘
针对FP-growth算法时空效率低的问题,提出了改进的FP-tree构造算法。该算法利用动态结点插入技术构造FP-tree,能有效减小模式树的宽度,达到压缩空间的目的;同时,该算法提高了前缀路径的共享性,提高了算法的效率。针对密集型数据的频繁模式完全集难以挖掘的问题,文中提出了IFPmax最大频繁模式挖掘算法,在改进的IFP-tree结构的基础上,利用结点的秩进行预判断,充分利用最大频繁模式的性质对已经存在的结点进行标记,有效避免了节点的冗余遍历,提高了最大频繁模式挖掘算法的效率。实验表明,在不同的基准数据集上文中提出的算法更有效,避免了节点的冗余遍历,使最大频繁模式挖掘算法效率更高。
-
关键词
挖掘
动态结点插入技术
IFP-tree
最大频繁模式
ifpmax
-
Keywords
mining
dynamic node insert technique
IFP-tree
maximal frequent patterns
ifpmax
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-