期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于B-list的快速频繁模式挖掘算法 被引量:6
1
作者 李校林 杜托 刘彪 《计算机应用》 CSCD 北大核心 2017年第8期2357-2361,2367,共6页
针对现有的频繁模式挖掘算法存在建树复杂、挖掘效率低等问题,提出一种基于构造链表(B-list)的频繁模式挖掘(BLFPM)算法。BLFPM使用一种新的数据结构B-list表示频繁项集,通过连接两个k-1-频繁项集的B-list可以快速得到k-项集的支持度,... 针对现有的频繁模式挖掘算法存在建树复杂、挖掘效率低等问题,提出一种基于构造链表(B-list)的频繁模式挖掘(BLFPM)算法。BLFPM使用一种新的数据结构B-list表示频繁项集,通过连接两个k-1-频繁项集的B-list可以快速得到k-项集的支持度,避免了多次扫描数据库;针对连接两个B-list时间复杂度高的问题,给出了一种线性时间复杂度的连接方法,提高了BLFPM的时间效率;同时,BLFPM采用集合枚举树代表搜索空间,并使用子集非频繁剪枝策略,减小了频繁模式挖掘的搜索空间,提高了算法的执行速度。实验结果表明,与NSFI算法和prepost算法相比,BLFPM的时间效率提高约12%到29%,空间效率提高约10%到24%,对稀疏数据库或稠密数据库进行频繁模式挖掘均可以得到良好的效果。 展开更多
关键词 数据挖掘 模式挖掘 频繁项集 遍历构造树 构造链表
在线阅读 下载PDF
一种基于前缀广义表的关联规则增量式更新算法 被引量:23
2
作者 杨明 孙志挥 《计算机学报》 EI CSCD 北大核心 2003年第10期1318-1325,共8页
关联规则挖掘是数据挖掘研究的一个重要方面 ,关联规则的高效维护算法研究是当前研究的热点 .传统更新算法与Apriori算法框架一致 ,要多遍扫描数据库并产生大量的候选项目集 .为此 ,该文对FP tree进行了改进 ,引入了前缀广义表———PG ... 关联规则挖掘是数据挖掘研究的一个重要方面 ,关联规则的高效维护算法研究是当前研究的热点 .传统更新算法与Apriori算法框架一致 ,要多遍扫描数据库并产生大量的候选项目集 .为此 ,该文对FP tree进行了改进 ,引入了前缀广义表———PG List,并提出了基于PG List的关联规则挖掘 (MARBPGL)与增量式更新算法(IUABPGL) .算法MARBPGL仅须扫描数据库两遍 ,算法IUABPGL在最坏的情况下仅须扫描原数据库一遍 ,扫描新增数据库两遍 ,且两个算法均无须生成候选项目集 ,避免了产生“知识的组合爆炸” ,提高了挖掘和维护的效率 .理论分析和实验结果表明该文提出的算法是有效可行的 . 展开更多
关键词 关联规则 增量式更新算法 前缀广义表 数据挖掘 频繁模式树 数据库 APRIORI算法
在线阅读 下载PDF
基于循环十字链表的频繁模式挖掘算法 被引量:5
3
作者 段仰广 韦玉科 《计算机技术与发展》 2009年第10期73-76,共4页
FP-growth算法是当前挖掘频繁模式的有效算法之一,但FP树的节点占用空间较大,长时间占用内存不释放,挖掘过程中需要产生大量的条件FP树,因而时空效率不理想。提出了一种循环十字链表结构用作存储事务数据库,而不生成FP树,在挖掘频繁项... FP-growth算法是当前挖掘频繁模式的有效算法之一,但FP树的节点占用空间较大,长时间占用内存不释放,挖掘过程中需要产生大量的条件FP树,因而时空效率不理想。提出了一种循环十字链表结构用作存储事务数据库,而不生成FP树,在挖掘频繁项集的过程中,这种链表结构逐步缩小,减少了内存的使用率,通过构建排序的条件频繁模式树挖掘频繁项集。理论分析和实验表明基于这种结构的排序条件频繁模式树挖掘频繁项集具有较好的时空效率。 展开更多
关键词 频繁模式 循环十字链表 排序条件频繁模式树
在线阅读 下载PDF
采用频繁项目链表变换的频繁项目集挖掘算法 被引量:3
4
作者 周海岩 《小型微型计算机系统》 CSCD 北大核心 2008年第7期1254-1257,共4页
频繁项目集的产生是关联规则挖掘的关键问题,经典的关联规则挖掘算法是通过对事务数据库的多次扫描实现的.最新的研究已经开始探索合适的数据结构以支持进行极少次数的事务数据库的扫描,进而减少关联规则挖掘过程中巨大的I/O开销以获得... 频繁项目集的产生是关联规则挖掘的关键问题,经典的关联规则挖掘算法是通过对事务数据库的多次扫描实现的.最新的研究已经开始探索合适的数据结构以支持进行极少次数的事务数据库的扫描,进而减少关联规则挖掘过程中巨大的I/O开销以获得更高的效率.文中利用频繁项目链表的数据结构,给出了一种仅需扫描两次事务数据库的关联规则挖掘算法,称为FILLT算法.该算法采取分而治之策略,对频繁项目链表实施分割、变换来进行关联规则挖掘.文中最后对这一算法的效率进行了理论分析和实验验证. 展开更多
关键词 频繁项目链表 数据挖掘 关联规则 频繁模式 频繁项目集
在线阅读 下载PDF
基于线性表的闭频繁项集挖掘算法
5
作者 李秦 张馨东 +1 位作者 童甲佳 李宇博 《兰州大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第4期122-126,共5页
利用频繁模式表的线性表简单结构及闭频繁项集挖掘的优点,提出了一种闭频繁项集挖掘算法.模式签名向量间的合取操作以及向量计数操作为该算法的主要操作,实现从已生成的闭频繁项集生成集中抽取代表模式,降低了模式搜索空间,简化了生成... 利用频繁模式表的线性表简单结构及闭频繁项集挖掘的优点,提出了一种闭频繁项集挖掘算法.模式签名向量间的合取操作以及向量计数操作为该算法的主要操作,实现从已生成的闭频繁项集生成集中抽取代表模式,降低了模式搜索空间,简化了生成闭频繁项集的过程,实验结果验证了该算法的有效性. 展开更多
关键词 闭频繁项集 签名向量 向量合取 向量计数 频繁模式表
在线阅读 下载PDF
频繁项集高效挖掘算法研究 被引量:2
6
作者 刘芝怡 常睿 《微计算机信息》 2012年第10期491-493,共3页
为进一步提高频繁项集挖掘算法的可扩展性,对频繁项集的搜索空间以及FP-tree的操作方法进行了研究。在此基础上提出了基于frequent-pattern链表的高效频繁项集挖掘算法FPL-Growth。FPL-Growth运用递增构建候选项集策略和Apriori性质来... 为进一步提高频繁项集挖掘算法的可扩展性,对频繁项集的搜索空间以及FP-tree的操作方法进行了研究。在此基础上提出了基于frequent-pattern链表的高效频繁项集挖掘算法FPL-Growth。FPL-Growth运用递增构建候选项集策略和Apriori性质来缩小搜索空间,运用交叉计数方法快速获取频繁项集的支持数。最后的实验证明了该算法的有效性。 展开更多
关键词 frequent-pattern链表 频繁项集 数据挖掘
在线阅读 下载PDF
基于频繁模式表的关联分类器构建算法研究
7
作者 李秦 张馨东 +1 位作者 童甲佳 李宇博 《计算机应用与软件》 CSCD 2011年第6期39-42,共4页
关联分类具有较高的分类精度和较强的适应性。基于闭频繁项集有效压缩事务及FPL(Frequent Pattern List)简单数据结构等方面的优点,提出了一种关联分类器方法。设计了便于分类的FPL变形模式,引入了有效发现闭频繁项集的签名向量合取操... 关联分类具有较高的分类精度和较强的适应性。基于闭频繁项集有效压缩事务及FPL(Frequent Pattern List)简单数据结构等方面的优点,提出了一种关联分类器方法。设计了便于分类的FPL变形模式,引入了有效发现闭频繁项集的签名向量合取操作。将闭频繁项集挖掘方法应用于关联分类,提高了关联分类算法的分类效率及准确率。 展开更多
关键词 关联分类 分类器 闭频繁项集 向量合取 频繁模式表
在线阅读 下载PDF
用垂直数据格式构建FP增长树的算法 被引量:4
8
作者 李洪波 周莉 张吉赞 《计算机工程与应用》 CSCD 北大核心 2009年第8期161-164,共4页
目前FP增长树的建立采用的是事务-项目集数据格式,即水平数据格式,扫描数据库需要2次。采用垂直数据格式,即项目-事务集数据格式,按照最小事务项目表优先的原则投影事务-项目以建立FP增长树,扫描数据库仅需1次。设计了独特的垂直项目头... 目前FP增长树的建立采用的是事务-项目集数据格式,即水平数据格式,扫描数据库需要2次。采用垂直数据格式,即项目-事务集数据格式,按照最小事务项目表优先的原则投影事务-项目以建立FP增长树,扫描数据库仅需1次。设计了独特的垂直项目头表独特的存储结构,便于垂直数据的存储、事务的投影、FP树的建立和垂直数据的增量更新。 展开更多
关键词 水平数据格式 垂直数据格式 最小事务项目表 垂直项目头表 FP增长树
在线阅读 下载PDF
基于链表结构的频繁模式树构造
9
作者 马洋 赵旭俊 《太原科技大学学报》 2013年第2期85-90,共6页
FP-Growth算法在关联规则挖掘中是最经典的算法,主要通过频繁模式树(FP树)避免生成候选频繁项目集。针对FP-Growth算法中耗费内存严重的问题,采用链表存储方式,给出了FP-Growth算法的实现方法,其中单个结点采用链表形式来产生,频繁模式... FP-Growth算法在关联规则挖掘中是最经典的算法,主要通过频繁模式树(FP树)避免生成候选频繁项目集。针对FP-Growth算法中耗费内存严重的问题,采用链表存储方式,给出了FP-Growth算法的实现方法,其中单个结点采用链表形式来产生,频繁模式树采用左孩子右兄弟的存储结构来组织。在此基础上利用索引表,实现了对频繁模式树中共同前缀结点的快速查找,提高了频繁模式树构造的效率,解决了FP树构造算法中数据存储的瓶颈问题。最后以天体光谱数据和城市土壤数据作为数据集分别对该算法进行测试,实验结果表明,该方法的构造效率要明显优于基于顺序结构的FP-Growth算法。 展开更多
关键词 关联规则 频繁模式 链表结构 索引表 光谱数据
在线阅读 下载PDF
基于间隔链表改进的频繁项集挖掘算法 被引量:4
10
作者 徐永秀 刘旭敏 徐维祥 《计算机应用》 CSCD 北大核心 2016年第4期997-1001,共5页
针对PrePost算法中需要建立复杂的前序和后序编码树(PPC-tree)和节点链表(N-list)的问题,提出一种基于间隔链表(I-list)改进的高效频繁项集挖掘算法。首先,该算法采用了比频繁模模式树(FP-tree)更加压缩的数据存储结构间隔编码的频繁模... 针对PrePost算法中需要建立复杂的前序和后序编码树(PPC-tree)和节点链表(N-list)的问题,提出一种基于间隔链表(I-list)改进的高效频繁项集挖掘算法。首先,该算法采用了比频繁模模式树(FP-tree)更加压缩的数据存储结构间隔编码的频繁模式树(IFP-tree),无需迭代地建立条件FP-tree;其次,该算法利用更简洁的I-list代替了PrePost中复杂的N-list,从而提高了建树和挖掘速度;最后,对于单分支路径的情况,该算法通过组合的方法,直接求得某些频繁项集,以提高算法的时间性能。实验结果表明:一方面,对于同一数据集在相同支持数下挖掘的结果相同,验证了改进算法的正确性;另一方面,无论在时间还是空间上改进算法的整体性能均比PrePost算法提高约10%;且对于稀疏型数据库或密集型数据库的挖掘都有较好的应用。 展开更多
关键词 数据挖掘 关联规则 频繁项集 频繁模式树 间隔链表
在线阅读 下载PDF
基于FP-参考树/表的频繁模式挖掘算法 被引量:2
11
作者 石巍 傅彦 《计算机科学》 CSCD 北大核心 2006年第6期206-209,共4页
通分析FP-growth算法中包含的冗余操作,引入数据结构FP参考树/表,改变FP-growth算法中条件模式基的存储和生成方式,提出了新的FPRSG算法,高效地解决了频繁模式挖掘问题。理论分析与实验结果表明,FPRSG算法优于FP-growth算法。
关键词 关联规则 频繁模式 FP参考树/表 FP参考收缩/增长算法 条件模式基
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部