期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
在单向FP-tree上挖掘频繁闭项集 被引量:4
1
作者 王现君 宋晶晶 姜保庆 《计算机工程与应用》 CSCD 北大核心 2008年第10期150-153,237,共5页
频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数... 频繁闭项集提供了频繁项集的一种完整的、最小表示。针对稠密数据集,提出一种基于单向FP-tree的频繁闭项集挖掘算法Unid_FP-FCI。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算频繁闭项集的弊端,极大地降低了内存空间和时间开销,提高了挖掘效率。 展开更多
关键词 数据挖掘 频繁项集 频繁闭项集 单向FP-tree 被约束子树
在线阅读 下载PDF
在单向FP-tree上挖掘最大频繁项集 被引量:1
2
作者 宋晶晶 姜保庆 关丽霞 《现代计算机》 2010年第1期19-24,共6页
针对稠密数据集,提出一种基于单向FP-tree的最大频繁项集挖掘算法Unid_FP-Max2。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-t... 针对稠密数据集,提出一种基于单向FP-tree的最大频繁项集挖掘算法Unid_FP-Max2。该算法在挖掘过程中只生成被约束子树,而它是一种虚拟的树结构,在原有的单向FP-tree基础上用三个很小的数组来表示,因而避免了以往算法需递归构造条件FP-tree来计算最大频繁项集的弊端,极大的降低了内存空间和时间开销,提高了挖掘效率。实验表明,与FP-Max算法相比,算法的效率提高了1倍以上。 展开更多
关键词 数据挖掘 频繁项集 最大频繁项集 单向FP—tree 被约束子树
在线阅读 下载PDF
分布式全局频繁项目集的快速挖掘方法 被引量:11
3
作者 宋宝莉 覃征 《西安交通大学学报》 EI CAS CSCD 北大核心 2006年第8期923-927,共5页
针对传统的分布式全局频繁项目集挖掘算法存在大量的候选项目集,且求全局频繁项目集的网络通信代价过高等问题,提出了一种分布式数据库的全局频繁项目集快速挖掘算法(FDMA).该算法改进了频繁模式树(FP-树)的结构,将双向FP-树改为单向,... 针对传统的分布式全局频繁项目集挖掘算法存在大量的候选项目集,且求全局频繁项目集的网络通信代价过高等问题,提出了一种分布式数据库的全局频繁项目集快速挖掘算法(FDMA).该算法改进了频繁模式树(FP-树)的结构,将双向FP-树改为单向,每个节点只保留指向父结点的指针,减少了指针数,由此可节省1/3的树空间;同时通过传送用3个很小的数组表示的被约束子树,在此挖掘全局频繁项目集的过程中不再生成大量候选项目集或条件FP-树,从而减小了网络通信量,提高了挖掘效率.实验表明,所提算法的挖掘速度比传统的分布式数据库数据挖掘算法至少提高了1倍之多,随着数据库规模的增大,它的扩展性将更好. 展开更多
关键词 数据挖掘 分布式数据库 全局频繁项目集 被约束子树
在线阅读 下载PDF
基于频繁模式树的约束最大频繁项集挖掘算法 被引量:15
4
作者 花红娟 张健 陈少华 《计算机工程》 CAS CSCD 北大核心 2011年第9期78-80,共3页
多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖... 多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖掘效率。实验结果证明,该算法的效率优于同类算法。 展开更多
关键词 数据挖掘 最大频繁项集 约束最大频繁项集 频繁模式树 项约束
在线阅读 下载PDF
约束频繁模式树及其构造方法研究 被引量:2
5
作者 赵旭俊 张继福 蔡江辉 《小型微型计算机系统》 CSCD 北大核心 2010年第4期682-685,共4页
频繁模式挖掘是影响关联规则挖掘效率的主要步骤.采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出一种基于背景知识的频繁模式树-CFP-Tree(Constrain Frequent Pattern Tree),并给出了其构造算法CFPT-Construct,从而提高关联规... 频繁模式挖掘是影响关联规则挖掘效率的主要步骤.采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出一种基于背景知识的频繁模式树-CFP-Tree(Constrain Frequent Pattern Tree),并给出了其构造算法CFPT-Construct,从而提高关联规则挖掘结果的针对性,降低了FP-Tree构造的复杂性,有效地解决了FP-Tree构造算法中数据存储的瓶颈问题.最后以国家天文台提供的天体光谱数据作为数据集,实验验证了算法的有效性、针对性和高效率. 展开更多
关键词 数据挖掘 关联规则 约束频繁模式树 约束频繁模式 背景知识
在线阅读 下载PDF
基于约束FP树的天体光谱数据相关性分析系统研究 被引量:2
6
作者 赵旭俊 张继福 蔡江辉 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2008年第12期2996-2999,共4页
从海量天体光谱数据中挖掘光谱数据特征和物理化学性质之间内在的、隐含的相关性,是人类探索天文规律的一种有效方法。利用基于约束FP树的关联规则挖掘方法作为天体光谱数据相关性分析手段,采用VC++和Oracle9i作为开发工具,设计与实现... 从海量天体光谱数据中挖掘光谱数据特征和物理化学性质之间内在的、隐含的相关性,是人类探索天文规律的一种有效方法。利用基于约束FP树的关联规则挖掘方法作为天体光谱数据相关性分析手段,采用VC++和Oracle9i作为开发工具,设计与实现了天体光谱数据相关性分析系统,给出了其系统的软件体系结构和模块功能,并对光谱数据预处理、背景知识表示、CFP树构造、频繁模式提取及关联规则生成等关键技术以及关键模块的实现技术,进行了详细描述。系统运行结果表明,利用关联规则来描述、分析天体光谱数据特征和物理化学性质之间存在的相关性,是可行的和有价值的,从而为寻找天体规律提供了一种有效手段。 展开更多
关键词 天体光谱 数据挖掘 关联规则 FP树 约束频繁模式
在线阅读 下载PDF
一种基于TFP树的频繁项集改进挖掘算法 被引量:2
7
作者 董平 胥杰 苏力萍 《微计算机信息》 北大核心 2007年第33期139-140,97,共3页
FP-growth算法是一种被证明有效的频繁模式挖掘算法。但是由于在挖掘频繁模式时需要递归地生成大量的条件FP-树,其时空效率较低,本文针对这一问题,首先构造一种改进的TFP-树结构,然后在构造的TFP-tree基础上引入被约束子树提出一种基于... FP-growth算法是一种被证明有效的频繁模式挖掘算法。但是由于在挖掘频繁模式时需要递归地生成大量的条件FP-树,其时空效率较低,本文针对这一问题,首先构造一种改进的TFP-树结构,然后在构造的TFP-tree基础上引入被约束子树提出一种基于TFP树的频繁项集的改进挖掘算法,并对该算法进行性能分析,结果证明该算法在运行速度得到很大提高。 展开更多
关键词 数据挖掘 临时频繁模式树 被约束子树
在线阅读 下载PDF
基于MapReduce的约束频繁项集挖掘算法 被引量:3
8
作者 施亮 钱雪忠 《计算机工程与设计》 北大核心 2015年第10期2725-2728,2748,共5页
传统的约束频繁项集挖掘方法无法实现对较大数据量的快速处理,针对该问题,结合分布式框架Hadoop的分布式计算优势,提出一种基于MapReduce的约束频繁项集挖掘算法。将一个完整的挖掘任务分成若干个相对独立的子任务,根据用户自定义的约... 传统的约束频繁项集挖掘方法无法实现对较大数据量的快速处理,针对该问题,结合分布式框架Hadoop的分布式计算优势,提出一种基于MapReduce的约束频繁项集挖掘算法。将一个完整的挖掘任务分成若干个相对独立的子任务,根据用户自定义的约束条件对子任务进行并行挖掘,提高算法的执行效率。实验结果表明,该算法具有较好的实用性和良好的扩展性。 展开更多
关键词 数据挖掘 MapReduce编程模型 约束频繁项集 频繁模式树 关联规则
在线阅读 下载PDF
分布式数据库的全局频繁项目集高效更新算法 被引量:1
9
作者 宋宝莉 覃征 《计算机工程与应用》 CSCD 北大核心 2006年第31期157-160,共4页
提出了快速更新全局频繁项目集的算法IUAGFI(IncrementalUpdatingAlgorithmforGlobalFrequentItemsets)。该算法主要考虑数据库记录发生变化时全局频繁项目集的更新情况,在最坏的情况下仅需扫描各局部数据库一遍,并利用已建立的各局部... 提出了快速更新全局频繁项目集的算法IUAGFI(IncrementalUpdatingAlgorithmforGlobalFrequentItemsets)。该算法主要考虑数据库记录发生变化时全局频繁项目集的更新情况,在最坏的情况下仅需扫描各局部数据库一遍,并利用已建立的各局部改进的频繁模式树和已挖掘的结果,可避免传送某些原全局频繁项目对应的被约束子树,从而降低网络通讯代价。实验结果表明,该算法是有效可行的。 展开更多
关键词 数据挖掘 分布式数据库 全局频繁项目集 约束子树 更新
在线阅读 下载PDF
最大亚频繁模式挖掘算法研究 被引量:1
10
作者 张海清 刘胤田 《计算机工程》 CAS CSCD 北大核心 2011年第14期62-64,共3页
为解决传统最大频繁模式在项集频繁度与项集长度规模之间的制约关系,提出最大亚频繁模式概念及其挖掘算法MSFP-mining,包括最大亚频繁模式概念并分析其要素特点,基于AFP-tree、CMP-tree、SFP-tree、SFP-growth的候选MSFP挖掘方法,基于MS... 为解决传统最大频繁模式在项集频繁度与项集长度规模之间的制约关系,提出最大亚频繁模式概念及其挖掘算法MSFP-mining,包括最大亚频繁模式概念并分析其要素特点,基于AFP-tree、CMP-tree、SFP-tree、SFP-growth的候选MSFP挖掘方法,基于MSFP-tree的最大亚频繁模式超集检测和剪枝策略及对MSFP-mining挖掘性能的实验验证。实验结果表明,该算法利用差别频繁度实现核心项集、附加频繁项集、补充频繁项集的阶段性求取和组合,在保证项集频繁度基础上实现最大亚频繁模式挖掘,扩展频繁模式规模。 展开更多
关键词 模式挖掘 最大亚频繁模式 数据集 超集检测 MSFP-tree结构
在线阅读 下载PDF
一种基于局部重构树的改进频繁子图挖掘算法
11
作者 蒋廷耀 廖强 《武汉理工大学学报(信息与管理工程版)》 CAS 2011年第6期864-867,共4页
针对SFP算法在其构造频繁模式树时需扫描数据库两次,算法效率较低的问题,首先提出了一种局部重构树结构OFP,该结构在构造频繁模式时只需要扫描一次数据库即可获取所需信息,同时采用了基于Hash表的辅助存储结构来改进唯一标号图,节省了... 针对SFP算法在其构造频繁模式树时需扫描数据库两次,算法效率较低的问题,首先提出了一种局部重构树结构OFP,该结构在构造频繁模式时只需要扫描一次数据库即可获取所需信息,同时采用了基于Hash表的辅助存储结构来改进唯一标号图,节省了子图重构时间。然后基于OFP树结构,提出了一种改进的高效频繁模式挖掘算法OSFP。实验结果表明,OSFP算法在内存占用和执行时间上均优于SFP算法。 展开更多
关键词 频繁子图 图挖掘 HASH表 FP—tree
在线阅读 下载PDF
一种提高遗传算法子图挖掘效率的数据结构
12
作者 刘先锋 郭林沅 《计算机工程》 CAS CSCD 北大核心 2016年第11期207-212,共6页
为提高复杂网络中遗传算法的子图挖掘效率,在邻接表的链式结构基础上加入双树状结构,作为一种新型数据结构——邻接树。该结构中原邻接表的头结点和表结点均以AVL树的方式组织,可使时间和空间复杂度分别降低到O(lb(n^2))和O(n)。以多目... 为提高复杂网络中遗传算法的子图挖掘效率,在邻接表的链式结构基础上加入双树状结构,作为一种新型数据结构——邻接树。该结构中原邻接表的头结点和表结点均以AVL树的方式组织,可使时间和空间复杂度分别降低到O(lb(n^2))和O(n)。以多目标遗传算法为基础进行实验,结果表明,在生物网络和社会网络等规模较大的数据集上,邻接树的挖掘性能相比邻接表和十字链表有明显提高,并且具有较好的通用性。 展开更多
关键词 邻接树 复杂网络 子图挖掘 数据结构 遗传算法
在线阅读 下载PDF
基于矩阵技术的频繁项目集挖掘算法 被引量:4
13
作者 田王君 蒋军辉 陈士慧 《计算机工程》 CAS CSCD 北大核心 2011年第16期80-81,97,共3页
频繁模式挖掘算法FP-growth算法需递归地生成大量的条件FP-树,且耗费大量存储空间和时间。为此,采用矩阵技术统计约束子树中的频繁项集和频繁项集的支持度,以进行数据挖掘。实验结果表明,该频繁模式挖掘算法是有效的,具有较高的时间效... 频繁模式挖掘算法FP-growth算法需递归地生成大量的条件FP-树,且耗费大量存储空间和时间。为此,采用矩阵技术统计约束子树中的频繁项集和频繁项集的支持度,以进行数据挖掘。实验结果表明,该频繁模式挖掘算法是有效的,具有较高的时间效率及空间效率。 展开更多
关键词 频繁模式 FP-GROWTH算法 矩阵技术 数据挖掘 约束子树方法
在线阅读 下载PDF
基于单向频繁模式树的频繁项集挖掘算法 被引量:3
14
作者 蒋东洁 李玲娟 《计算机技术与发展》 2019年第10期175-180,共6页
频繁项集挖掘是关联规则挖掘的关键步骤。FP-Growth算法是一种有效的频繁项集挖掘算法,它以自底向上的方式探索频繁模式树FP-tree,由FP-tree产生频繁项集。但是由于需要递归生成大量的条件FP-tree,其时间复杂度和空间复杂度都较高。针... 频繁项集挖掘是关联规则挖掘的关键步骤。FP-Growth算法是一种有效的频繁项集挖掘算法,它以自底向上的方式探索频繁模式树FP-tree,由FP-tree产生频繁项集。但是由于需要递归生成大量的条件FP-tree,其时间复杂度和空间复杂度都较高。针对这一问题,设计了一种基于单向频繁模式树的频繁项集挖掘算法UFIM。此算法首先构造一种单向频繁模式树UFP-tree结构,然后在UFP-tree上引入被约束子树,并对指向不同端点和指向相同端点的被约束子树分别采用递归和非递归的方法来挖掘频繁项集。非递归的方法判断端点的支持度计数是否小于最小支持度计数,若小于最小支持度计数则该棵被约束子树无频繁项集,否则其频繁项集是除根节点外的节点的排列组合。在mushroom数据集上的实验结果表明,UFIM算法的运行速度高于同类算法。 展开更多
关键词 数据挖掘 频繁项集 单向频繁模式树 被约束子树
在线阅读 下载PDF
用模式增长方法挖掘嵌入式频繁子树 被引量:1
15
作者 马海兵 李荣陆 胡运发 《模式识别与人工智能》 EI CSCD 北大核心 2006年第2期208-214,共7页
提出用模式增长方法在带标记有序树构成的森林中挖掘嵌入式频繁子树.算法利用最右路径扩展方法构造完整的模式增长空间,然后根据待增长模式的拓扑结构确定其增长点并构造相应投影库,从而将挖掘频繁子树问题转化为在各投影库中寻找频繁... 提出用模式增长方法在带标记有序树构成的森林中挖掘嵌入式频繁子树.算法利用最右路径扩展方法构造完整的模式增长空间,然后根据待增长模式的拓扑结构确定其增长点并构造相应投影库,从而将挖掘频繁子树问题转化为在各投影库中寻找频繁节点问题.这大大降低算法的复杂性.实验表明其具有较高的时空效率. 展开更多
关键词 数据挖掘 频繁模式 模式增长 频繁子树
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部