期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
一种提高Apriori算法效率的方法 被引量:5
1
作者 区玉明 张师超 +2 位作者 徐章艳 卢景丽 刘美玲 《计算机工程与设计》 CSCD 2004年第5期846-848,共3页
Apriori算法是关联规则挖掘中的经典算法。在Apriori算法中,需要大量进行两个操作:判断两个k-项集是否前k-1项相同且最后一项不同;判断一个项集是否为另一个项集的子集。利用Apriori算法中项集之间都是有序的这一特点可以减少以上两个... Apriori算法是关联规则挖掘中的经典算法。在Apriori算法中,需要大量进行两个操作:判断两个k-项集是否前k-1项相同且最后一项不同;判断一个项集是否为另一个项集的子集。利用Apriori算法中项集之间都是有序的这一特点可以减少以上两个操作的执行次数,从而达到对Apriori算法进行优化的目的。实验结果表明,经过优化了的Apriori算法在运行效率上有一定的提高。 展开更多
关键词 APRIORI算法 关联规则挖掘 优化 效率 项集有序
在线阅读 下载PDF
挖掘关联规则中Apriori算法的一种改进 被引量:13
2
作者 刘兴涛 石冰 解英文 《山东大学学报(理学版)》 CAS CSCD 北大核心 2008年第11期67-71,共5页
针对制约Apriori算法效率的瓶颈问题,提出了一种对Apriori算法改进的策略,该策略利用二维数组标志位进行事务压缩和利用项集有序性进行项目压缩相结合。该算法减少连接次数以及扫描数据库的次数从而缩短数据库扫描时间,利用项集有序性... 针对制约Apriori算法效率的瓶颈问题,提出了一种对Apriori算法改进的策略,该策略利用二维数组标志位进行事务压缩和利用项集有序性进行项目压缩相结合。该算法减少连接次数以及扫描数据库的次数从而缩短数据库扫描时间,利用项集有序性改进判断是否进行连接的策略,并利用标志位变化逐步消除无用事务,从而实现了事务压缩和项目压缩,同时减少了判断时间。实验结果表明,经过优化了的Apriori算法在运行效率上有一定的提高。 展开更多
关键词 关联规则 APRIORI算法 二维数组 事务压缩 项集有序 项目压缩
在线阅读 下载PDF
Web使用挖掘中Apriori算法的改进研究 被引量:6
3
作者 许晓东 李柯 朱士瑞 《计算机工程与设计》 CSCD 北大核心 2010年第3期539-541,563,共4页
分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BI_Apriori算法。改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间。将项集有序性引入到该数组上,减少了候选项... 分析了挖掘频繁访问模式的过程和当前Apriori算法的缺陷,提出了一种Apriori算法的改进算法:BI_Apriori算法。改进的算法采用不规则数组来保存项集信息,有效省去了扫描数据库所耗费的大量时间。将项集有序性引入到该数组上,减少了候选项集的个数。并采用二进制来表示1阶频繁访问模式,提高了模式匹配和连接的效率。试验结果表明,该改进算法能更有效地发现各种长度不同的访问模式。 展开更多
关键词 WEB挖掘 不规则数组 项集有序性 二进制 访问模式
在线阅读 下载PDF
数据挖掘中关联规则的一种高效Apriori算法 被引量:29
4
作者 李清峰 杨路明 +1 位作者 张晓峰 龙艳军 《计算机应用与软件》 CSCD 北大核心 2004年第12期84-86,共3页
在数据挖掘中关联规则的频繁项集计算时 ,通过一种改进的Apriori算法 ,即用升序替代原来的按字母次序对项集进行排序 ,可大大精简候选频繁集 ,而且能保持频繁集的完整性 ,减少计算开销。
关键词 数据挖掘 关联规则 数据库 频繁项集 APRIORI算法
在线阅读 下载PDF
基于散列技术的高效剪枝关联规则挖掘算法 被引量:2
5
作者 彭永供 王靓明 +1 位作者 朱敏 段隆振 《南昌大学学报(理科版)》 CAS 北大核心 2009年第5期494-498,共5页
该算法结合项集的有序特性有效压缩了频繁项集的数量,提高了算法效率,但是频繁2-项集的产生仍需要占用大量的存储空间,本文利用散列函数对候选频繁2-项集进行剪枝,这样频繁集的数目大大减少,不仅节省了存储空间、减少了计算开销,而且又... 该算法结合项集的有序特性有效压缩了频繁项集的数量,提高了算法效率,但是频繁2-项集的产生仍需要占用大量的存储空间,本文利用散列函数对候选频繁2-项集进行剪枝,这样频繁集的数目大大减少,不仅节省了存储空间、减少了计算开销,而且又保持了频繁项集的完整性。 展开更多
关键词 关联规则 APRIORI性质 散列函数 项集有序 频繁项集
在线阅读 下载PDF
一种基于矩阵的强关联规则生成算法 被引量:17
6
作者 吕桃霞 刘培玉 《计算机应用研究》 CSCD 北大核心 2011年第4期1301-1303,共3页
针对Apriori算法扫描数据库的I/O代价和候选项集数目较多等问题,提出一种基于矩阵的强关联规则生成算法。该算法通过将事务数据库转换为0-1矩阵后对项集按照支持度计数非递减顺序排列,从而减少了候选项集的产生,同时实现置信度的高效计... 针对Apriori算法扫描数据库的I/O代价和候选项集数目较多等问题,提出一种基于矩阵的强关联规则生成算法。该算法通过将事务数据库转换为0-1矩阵后对项集按照支持度计数非递减顺序排列,从而减少了候选项集的产生,同时实现置信度的高效计算。通过对实例和大数据量数据库的分析表明,该方法是有效的。 展开更多
关键词 关联规则 排序矩阵 候选项集 频繁项集 置信度
在线阅读 下载PDF
用有序FP-tree挖掘最大频繁项集 被引量:7
7
作者 于红 王秀坤 孟军 《控制与决策》 EI CSCD 北大核心 2007年第5期520-524,共5页
提出了完全前缀路径和有序FP-tree的概念,给出根据数据项所在的层建立有序FP-tree的方法,利用有序FP-tree表示数据.提出用有序FP-tree中的完全前缀路径进行最大频繁项集挖掘的算法——MFIM算法,该算法利用有序FP-tree中的完全前缀路径... 提出了完全前缀路径和有序FP-tree的概念,给出根据数据项所在的层建立有序FP-tree的方法,利用有序FP-tree表示数据.提出用有序FP-tree中的完全前缀路径进行最大频繁项集挖掘的算法——MFIM算法,该算法利用有序FP-tree中的完全前缀路径对挖掘算法进行优化.实验结果表明,该算法对于浓密数据集中挖掘长模式具有较好的性能. 展开更多
关键词 最大频繁项集 有序FP-tree数据挖掘 MFIM算法
在线阅读 下载PDF
在线挖掘数据流滑动窗口中最大频繁项集 被引量:9
8
作者 敖富江 颜跃进 +1 位作者 刘宝宏 黄柯棣 《系统仿真学报》 CAS CSCD 北大核心 2009年第4期1134-1139,共6页
相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率。提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS。该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪... 相对于频繁项集,最大频繁项集的数目较少,挖掘最大频繁项集的算法具有较高的时空效率。提出了一种新的基于文法顺序FP-Tree的最大频繁项集单遍挖掘算法FPMFI-DS。该算法采用了一种混合搜索空间项顺序策略,并利用我们所提出的一种新的剪枝技术—"子集等价剪枝技术",有效缩小搜索空间的大小。基于该算法,提出了一种能够在线更新挖掘数据流滑动窗口中最大频繁项集的算法FPMFI-DS+。FPMFI-DS+算法能够在任意时刻都维护数据流当前窗口中的最大频繁项集。仿真实验表明,FPMFI-DS算法的效率接近于多遍挖掘算法FPMax*,并具有良好的可扩展性,FPMFI-DS+算法更新挖掘速度快。 展开更多
关键词 数据流 最大频繁项集 在线挖掘 滑动窗口 文法顺序FP-Tree
原文传递
基于分区的有向超团模式社交网络影响最大化算法
9
作者 郝怡然 盛益强 王劲林 《计算机应用》 CSCD 北大核心 2018年第A02期77-83,110,共8页
针对社交网络影响最大化算法存在的在大规模社交网络中没有充分考虑网络中有向拓扑结构、对I/O的访问次数过高、选择的初始激活节点聚集程度较高等问题,提出一种基于分区的有向超团模式的社交网络影响最大化算法。该算法首先发现社交网... 针对社交网络影响最大化算法存在的在大规模社交网络中没有充分考虑网络中有向拓扑结构、对I/O的访问次数过高、选择的初始激活节点聚集程度较高等问题,提出一种基于分区的有向超团模式的社交网络影响最大化算法。该算法首先发现社交网络中的极大连通子图,并从每个子图内发现关联规则,以减少I/O次数。从每个子图中分别挖掘社交网络中的有向超团,引入Apriori的改进算法发现有序频繁集,并从有序频繁集中挖掘关联规则;之后在关联规则的基础上结合节点的度数对种子节点进行选取,将选出的种子节点在独立级联模型上进行传播。其中,由于传统的Apriori算法仅适用于从无序项集中发现频繁集,因此对项集合并时的重组规则进行改进,使其适用于发现有序频繁集。采用KDD2012数据集进行了实验,结果表明:该模型在很大程度上避免了节点影响所产生的重叠效果,进而取得比现有启发式算法更优的影响效果;初始激活节点小于1 000时,该算法最终影响节点数可以达到最新影响力算法(k-核算法)的两倍。 展开更多
关键词 有向超团 APRIORI改进算法 分区 有序频繁集 影响最大化算法 独立级联模型 社交网络
在线阅读 下载PDF
基于排序矩阵和树的关联规则挖掘算法 被引量:7
10
作者 朱意霞 姚力文 +1 位作者 黄水源 黄龙军 《计算机科学》 CSCD 北大核心 2006年第7期196-198,共3页
最大频繁项集的生成是影响关联规则挖掘的关键问题,Apriori算法从大量的候选频繁项集产生频繁项集的过程是非常耗时的过程。本文提出了一种新的算法,该算法结合项集的有序特性构造矩阵,使生成树的每一层结点从左往右按支持度大小升序排... 最大频繁项集的生成是影响关联规则挖掘的关键问题,Apriori算法从大量的候选频繁项集产生频繁项集的过程是非常耗时的过程。本文提出了一种新的算法,该算法结合项集的有序特性构造矩阵,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且能保持频繁项集的完整性,从而节约了计算开销,提高了算法的效率。 展开更多
关键词 关联规则 APRIORI算法 项集有序 频繁项集
在线阅读 下载PDF
基于有序FP-tree结构和投影数据库的最大频繁模式挖掘算法 被引量:1
11
作者 王利军 唐立 《淮阴师范学院学报(自然科学版)》 CAS 2020年第1期35-39,44,共6页
OPFP-MAX是基于有序FP-tree结构和投影数据库的最大频繁模式挖掘算法。有序FP-tree结构不仅可以减少空间的浪费,而且由于树结构的有序性,在挖掘数据时可以减少挖掘事务项的数量,从而加快挖掘效率。算法采用垂直投影方案实现数据分解,基... OPFP-MAX是基于有序FP-tree结构和投影数据库的最大频繁模式挖掘算法。有序FP-tree结构不仅可以减少空间的浪费,而且由于树结构的有序性,在挖掘数据时可以减少挖掘事务项的数量,从而加快挖掘效率。算法采用垂直投影方案实现数据分解,基于投影数据库创建局部树结构,从而进一步减少对系统空间资源的浪费。采用优化策略加快挖掘效率。实验验证了算法的可行性和优越性。 展开更多
关键词 有序FP-tree 投影数据库 最大频繁项集
在线阅读 下载PDF
基于有序FP-tree结构和二维表的最大频繁模式挖掘算法
12
作者 王利军 唐立 《韶关学院学报》 2019年第9期21-25,共5页
Order Table FPMax是基于有序FP-tree结构和二维表的最大频繁模式挖掘算法.有序FP-tree结构可以减少空间的浪费.基于树结构的有序性,算法在挖掘数据时可以减少挖掘事务项的数量,加快挖掘效率.算法采用二维表存储挖据事务项的路径信息及... Order Table FPMax是基于有序FP-tree结构和二维表的最大频繁模式挖掘算法.有序FP-tree结构可以减少空间的浪费.基于树结构的有序性,算法在挖掘数据时可以减少挖掘事务项的数量,加快挖掘效率.算法采用二维表存储挖据事务项的路径信息及交集,采用相应的计算方法可以在不产生条件子树的情况下快速得到最大频繁项集,并避免没必要的挖掘过程减少超集检测,既减少了空间的浪费,又加快了执行效率. 展开更多
关键词 有序FP-tree 二维表 最大频繁项集 orderTableFPMax
在线阅读 下载PDF
基于有序FP-tree的最大长度频繁项集挖掘算法 被引量:4
13
作者 廖福蓉 王成良 《计算机工程与应用》 CSCD 2012年第30期147-150,共4页
频繁项集的挖掘受到大量候选频繁项集和较高计算花费的限制,只挖掘最大长度频繁项集已满足很多应用。提出一种基于有序FP-tree结构挖掘最大长度频繁项集的算法。即对有序FP-tree的头表进行改造,增加一个max-level域,记录该项在有序FP-t... 频繁项集的挖掘受到大量候选频繁项集和较高计算花费的限制,只挖掘最大长度频繁项集已满足很多应用。提出一种基于有序FP-tree结构挖掘最大长度频繁项集的算法。即对有序FP-tree的头表进行改造,增加一个max-level域,记录该项在有序FP-tree中的最大高度。挖掘时仅对max-level大于等于已有最大长度频繁项集长度的项进行遍历,不产生条件模式基,无需递归构造条件FP-tree,且计算出最大长度频繁项集的支持度。实验结果表明该算法挖掘效率高、速度快。 展开更多
关键词 最大长度频繁项集 数据挖掘 频繁项集 有序频繁模式树(FP)-tree
在线阅读 下载PDF
一种改进的Apriori挖掘算法 被引量:1
14
作者 李唐平 陶宏才 《成都信息工程学院学报》 2009年第6期537-540,共4页
针对制约Apriori算法效率的瓶颈问题,提出了一种基于Apriori的改进算法,算法只需要遍历一次事务数据库,避免了Apriori算法多次扫描事务数据库和产生大量的候选项集,同时利用项集的有序性改进了判断连接的方式,优化了连接步骤,减少了判... 针对制约Apriori算法效率的瓶颈问题,提出了一种基于Apriori的改进算法,算法只需要遍历一次事务数据库,避免了Apriori算法多次扫描事务数据库和产生大量的候选项集,同时利用项集的有序性改进了判断连接的方式,优化了连接步骤,减少了判断时间。实验结果表明,改进的Apriori算法在运行效率上有一定的提高。 展开更多
关键词 计算机应用技术 数据挖掘 关联规则 APRIORI算法 项集有序 最小支持数
在线阅读 下载PDF
挖掘滑动时间衰减窗口中网络流频繁项集 被引量:4
15
作者 赖军 李双庆 《计算机应用研究》 CSCD 北大核心 2011年第3期895-898,共4页
网络流数据频繁项集挖掘是网络流量分析的重要基础。提出一种新颖的基于字典顺序前缀树LOP-Tree的频繁项集挖掘算法STFWFI,该算法采用更符合网络流特点的滑动时间衰减窗口模型,有效降低了挖掘频繁项集的时间和空间复杂度;在该树结构上... 网络流数据频繁项集挖掘是网络流量分析的重要基础。提出一种新颖的基于字典顺序前缀树LOP-Tree的频繁项集挖掘算法STFWFI,该算法采用更符合网络流特点的滑动时间衰减窗口模型,有效降低了挖掘频繁项集的时间和空间复杂度;在该树结构上提出一种新的基于统计分布的节点权值计算方法SDNW代替传统的统计方法,提高了网络流节点估值的精确度。实验结果表明,该算法在网络流频繁项集挖掘过程中获得了良好的效果。 展开更多
关键词 网络流数据挖掘 频繁项集 滑动时间衰减窗口 字典顺序前缀树
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部