-
题名一种不确定数据集上频繁模式挖掘的近似算法
被引量:8
- 1
-
-
作者
王水
祝孔涛
王乐
-
机构
宁波大红鹰学院信息工程学院
南阳理工学院软件学院
大连理工大学电子信息与电气工程学部计算机科学与技术学院
-
出处
《计算机应用研究》
CSCD
北大核心
2014年第3期725-728,共4页
-
基金
国家自然科学基金资助项目(61173163)
宁波市自然科学基金资助项目(2013A610115)
宁波大红鹰学院大宗商品专项项目
-
文摘
为提高不确定数据集上频繁模式挖掘的效率,针对已有算法在判断是否需要为头表中的某项创建子头表时的计算量比较大的问题,给出一个近似挖掘策略AAT-Mine,以损失小部分频繁项集为代价,提高整个算法的挖掘效率。采用三个不同的典型数据集进行了算法的测试,分别与目前最好的算法和典型算法进行性能对比。实验结果验证了近似算法AAT-Mine的时空效率都得到了提高。
-
关键词
数据挖掘
频繁模式
频繁项集
不确定数据集
近似算法
-
Keywords
vdata mining
frequent itemsets
frequent pattern
uncertain dataset
approximation algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名面向不确定数据模式指标的通用界值估算方法
- 2
-
-
作者
王菊
刘付显
靳春杰
-
机构
空军工程大学防空反导学院
[
-
出处
《计算机应用》
CSCD
北大核心
2018年第1期165-170,共6页
-
文摘
针对约束模式挖掘中模式指标的界值估算问题,提出了一种面向不确定数据模式指标的通用界值估算方法。根据带有权值的不确定型事务数据库的特点,首先设计了面向常用模式指标的通用界值估算框架,其次给出了在该框架下对模式指标上界值的快速估算方法,最后估计了两种典型模式指标的上界值以说明其可行性。实验中对比了PHUI-UP算法分别结合事务加权效用值、所提方法估算所得的上界值和实际上界值后的运行时间和内存占用情况,实验结果表明所提方法可以通过占用较小内存和运行时间来实现模式效用上界值的估算。
-
关键词
不确定数据库
模式指标
界值估算
约束模式挖掘
通用估算框架
-
Keywords
uncertain dataset
pattern measure
bound estimation
constraint-based pattern mining
general estimationframework
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名不确定数据集的模式挖掘
- 3
-
-
作者
陈凤娟
-
机构
辽宁对外经贸学院基础教研部
-
出处
《商丘师范学院学报》
CAS
2015年第12期16-19,共4页
-
文摘
在传统的事务数据库中,频繁模式的挖掘是一个已经有很多较好解决办法的问题,但是在不确定数据集上,仅仅提出了几种频繁模式的挖掘技术,而这些新技术对于不确定数据集中的项的不确定性的处理效果不是很好.本文主要探讨在可能世界的概念下,用基于抽样的方法来处理不确定数据,并在此基础上,研究在保证较低的精度损失下优化频繁模式挖掘算法.
-
关键词
不确定数据集
模式挖掘
期望支持度
-
Keywords
uncertain dataset
pattern mining
expected support
-
分类号
TP311.12
[自动化与计算机技术—计算机软件与理论]
-