期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
约束频繁模式树及其构造方法研究 被引量:2
1
作者 赵旭俊 张继福 蔡江辉 《小型微型计算机系统》 CSCD 北大核心 2010年第4期682-685,共4页
频繁模式挖掘是影响关联规则挖掘效率的主要步骤.采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出一种基于背景知识的频繁模式树-CFP-Tree(Constrain Frequent Pattern Tree),并给出了其构造算法CFPT-Construct,从而提高关联规... 频繁模式挖掘是影响关联规则挖掘效率的主要步骤.采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出一种基于背景知识的频繁模式树-CFP-Tree(Constrain Frequent Pattern Tree),并给出了其构造算法CFPT-Construct,从而提高关联规则挖掘结果的针对性,降低了FP-Tree构造的复杂性,有效地解决了FP-Tree构造算法中数据存储的瓶颈问题.最后以国家天文台提供的天体光谱数据作为数据集,实验验证了算法的有效性、针对性和高效率. 展开更多
关键词 数据挖掘 关联规则 约束频繁模式树 约束频繁模式 背景知识
在线阅读 下载PDF
基于频繁模式树的约束最大频繁项集挖掘算法 被引量:15
2
作者 花红娟 张健 陈少华 《计算机工程》 CAS CSCD 北大核心 2011年第9期78-80,共3页
多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖... 多数最大频繁项集挖掘算法产生候选项目集的代价很高,而实际应用中用户只关心部分关联规则。针对该问题,提出一种基于频繁模式树的约束最大频繁项集快速挖掘算法。该算法能随时删除不满足约束条件的项集,无需生成候选项目集,由此提高挖掘效率。实验结果证明,该算法的效率优于同类算法。 展开更多
关键词 数据挖掘 最大频繁项集 约束最大频繁项集 频繁模式树 项约束
在线阅读 下载PDF
基于约束FP树的天体光谱数据相关性分析系统研究 被引量:2
3
作者 赵旭俊 张继福 蔡江辉 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2008年第12期2996-2999,共4页
从海量天体光谱数据中挖掘光谱数据特征和物理化学性质之间内在的、隐含的相关性,是人类探索天文规律的一种有效方法。利用基于约束FP树的关联规则挖掘方法作为天体光谱数据相关性分析手段,采用VC++和Oracle9i作为开发工具,设计与实现... 从海量天体光谱数据中挖掘光谱数据特征和物理化学性质之间内在的、隐含的相关性,是人类探索天文规律的一种有效方法。利用基于约束FP树的关联规则挖掘方法作为天体光谱数据相关性分析手段,采用VC++和Oracle9i作为开发工具,设计与实现了天体光谱数据相关性分析系统,给出了其系统的软件体系结构和模块功能,并对光谱数据预处理、背景知识表示、CFP树构造、频繁模式提取及关联规则生成等关键技术以及关键模块的实现技术,进行了详细描述。系统运行结果表明,利用关联规则来描述、分析天体光谱数据特征和物理化学性质之间存在的相关性,是可行的和有价值的,从而为寻找天体规律提供了一种有效手段。 展开更多
关键词 天体光谱 数据挖掘 关联规则 FP树 约束频繁模式
在线阅读 下载PDF
基于MapReduce的约束频繁项集挖掘算法 被引量:3
4
作者 施亮 钱雪忠 《计算机工程与设计》 北大核心 2015年第10期2725-2728,2748,共5页
传统的约束频繁项集挖掘方法无法实现对较大数据量的快速处理,针对该问题,结合分布式框架Hadoop的分布式计算优势,提出一种基于MapReduce的约束频繁项集挖掘算法。将一个完整的挖掘任务分成若干个相对独立的子任务,根据用户自定义的约... 传统的约束频繁项集挖掘方法无法实现对较大数据量的快速处理,针对该问题,结合分布式框架Hadoop的分布式计算优势,提出一种基于MapReduce的约束频繁项集挖掘算法。将一个完整的挖掘任务分成若干个相对独立的子任务,根据用户自定义的约束条件对子任务进行并行挖掘,提高算法的执行效率。实验结果表明,该算法具有较好的实用性和良好的扩展性。 展开更多
关键词 数据挖掘 MapReduce编程模型 约束频繁项集 频繁模式树 关联规则
在线阅读 下载PDF
基于FP-tree和约束概念格的关联规则挖掘算法及应用研究 被引量:27
5
作者 付冬梅 王志强 《计算机应用研究》 CSCD 北大核心 2014年第4期1013-1015,1019,共4页
现有的基于频繁模式树FP-tree和概念格的规则挖掘算法在构造概念格时存在重复遍历FP-tree问题,在挖掘后件约束的规则时算法构造的概念格包含冗余结点。针对这两个问题,提出了通过遍历FP-tree生成候选概念格节点的策略,并根据候选概念格... 现有的基于频繁模式树FP-tree和概念格的规则挖掘算法在构造概念格时存在重复遍历FP-tree问题,在挖掘后件约束的规则时算法构造的概念格包含冗余结点。针对这两个问题,提出了通过遍历FP-tree生成候选概念格节点的策略,并根据候选概念格节点进一步构造规则约束条件下无冗余概念格。通过实际项目中大气腐蚀数据进行算法的应用,结果表明该算法比现有算法具有更高的挖掘效率且腐蚀规则结果对材料腐蚀现状研究具有重要指导价值。 展开更多
关键词 规则挖掘 频繁模式树 约束概念格 材料腐蚀
在线阅读 下载PDF
基于修正BPSO的通用模式指标上界估算方法
6
作者 王菊 刘付显 靳春杰 《计算机工程》 CAS CSCD 北大核心 2018年第10期168-174,共7页
针对约束频繁模式挖掘中模式指标的界值估算问题,提出一种基于修正二进制粒子群优化(BPSO)算法的通用模式指标上界估算方法。根据带有权值的不确定型事务数据库的特点,建立通用的模式指标上界估算框架,并提出在该框架下基于修正BPSO的... 针对约束频繁模式挖掘中模式指标的界值估算问题,提出一种基于修正二进制粒子群优化(BPSO)算法的通用模式指标上界估算方法。根据带有权值的不确定型事务数据库的特点,建立通用的模式指标上界估算框架,并提出在该框架下基于修正BPSO的模式指标上界值求解方法。对比UHUI-Apriori算法分别结合事务加权效用值、本文方法估算所得上界值和实际上界值后的候选项集数量、运行时间和内存占用情况,结果表明,该方法可以较快计算模式效用的上界值,且能够节省运行时间和内存空间。 展开更多
关键词 不确定型数据库 模式指标 界值估算 粒子群优化算法 约束频繁模式挖掘
在线阅读 下载PDF
基于频繁模式树的正负项目集挖掘 被引量:2
7
作者 赵旭俊 《太原科技大学学报》 2012年第1期18-22,共5页
传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于... 传统的基于支持度—置信度框架的关联规则挖掘方法可能会产生大量不相关的、甚至是误导的关联规则,同时也不能区分正负关联规则。在充分考虑用户感兴趣模式的基础上,采用一阶谓词逻辑作为用户感兴趣的背景知识表示技术,提出了一种基于背景知识的包含正负项目集的频繁模式树,给出了针对正负项目集的约束频繁模式树的构造算法NCFP-Construct,从而提高了关联规则挖掘的效率和针对性,实验结果显示该方法是有效的。 展开更多
关键词 约束 频繁模式树 负项目集 关联规则
在线阅读 下载PDF
MapReduce编程模型下的约束频繁模式挖掘算法 被引量:2
8
作者 闫晓妩 张继福 +1 位作者 荀亚玲 赵旭俊 《小型微型计算机系统》 CSCD 北大核心 2015年第10期2257-2261,共5页
约束频繁模式是利用用户给定的约束条件,生成的一种频繁模式,具有针对性强、挖掘效率高等特点.随着数据量的增大,约束频繁模式生成过程存在着占用内存大和I/O代价高等问题,难以适用于海量高维数据集.采用MapReduce编程模型,给出一种约... 约束频繁模式是利用用户给定的约束条件,生成的一种频繁模式,具有针对性强、挖掘效率高等特点.随着数据量的增大,约束频繁模式生成过程存在着占用内存大和I/O代价高等问题,难以适用于海量高维数据集.采用MapReduce编程模型,给出一种约束频繁模式并行挖掘MCFP算法.该算法首先,采用三对Map和Reduce函数实现了将数据中事务映射为频繁项计数、构建约束频繁模式树和生成约束频繁模式,以及频繁模式聚合等主要步骤;其次,根据频繁项支持度,迁移数据记录,有效地实现了频繁模式生成过程中的负载均衡;最后,采用天体光谱数据,实验验证了该算法的有效性、可伸缩性和可扩展性. 展开更多
关键词 约束频繁模式 MapReduce编程模型 CFP—Tree 支持度 负载均衡
在线阅读 下载PDF
一种约束最大频繁模式快速挖掘算法
9
作者 王闻 谢伙生 《微计算机信息》 2009年第15期143-145,共3页
为了避免用户通过"二次挖掘"才能得到有用的结果集,本文提出了一种新的约束最大频繁模式挖掘算法CSMFP-Max。CSMFP-Max算法基于CFP树和对称矩阵,在挖掘过程中采用了多种剪枝策略并结合了自顶向下和自底向上的双向搜索策略,大... 为了避免用户通过"二次挖掘"才能得到有用的结果集,本文提出了一种新的约束最大频繁模式挖掘算法CSMFP-Max。CSMFP-Max算法基于CFP树和对称矩阵,在挖掘过程中采用了多种剪枝策略并结合了自顶向下和自底向上的双向搜索策略,大大缩小了候选集规模,避免了不必要的条件CFP树的产生。理论分析和实验结果表明CSMFP-Max算法是一种高效的约束最大频繁模式挖掘算法,具有良好的时空效率。 展开更多
关键词 约束最大频繁模式 对称矩阵 CFP树
在线阅读 下载PDF
Discovering top-k patterns with differential privacy-an accurate approach 被引量:3
10
作者 Xiaojian ZHANG Xiaofeng MENG 《Frontiers of Computer Science》 SCIE EI CSCD 2014年第5期816-827,共12页
Frequent pattern mining discovers sets of items that frequently appear together in a transactional database; these can serve valuable economic and research purposes. However, if the database contains sensitive data (... Frequent pattern mining discovers sets of items that frequently appear together in a transactional database; these can serve valuable economic and research purposes. However, if the database contains sensitive data (e.g., user behavior records, electronic health records), directly releas- ing the discovered frequent patterns with support counts will carry significant risk to the privacy of individuals. In this pa- per, we study the problem of how to accurately find the top-k frequent patterns with noisy support counts on transactional databases while satisfying differential privacy. We propose an algorithm, called differentially private frequent pattern (DFP- Growth), that integrates a Laplace mechanism and an expo- nential mechanism to avoid privacy leakage. We theoretically prove that the proposed method is (λ, δ)-useful and differ- entially private. To boost the accuracy of the returned noisy support counts, we take consistency constraints into account to conduct constrained inference in the post-processing step. Extensive experiments, using several real datasets, confirm that our algorithm generates highly accurate noisy support counts and top-k frequent patterns. 展开更多
关键词 frequent pattern mining differential privacy constrained inference.
原文传递
一种基于约束FP树的天体光谱数据相关性分析方法 被引量:5
11
作者 张继福 赵旭俊 《模式识别与人工智能》 EI CSCD 北大核心 2009年第4期639-646,共8页
寻找未知的天文规律是人类探索宇宙奥妙所追求目标之一.利用关联规则来描述天体光谱数据特征与其物理化学性质之间存在的、未知的相关性,是实现该目标的一种有效手段.以国家重大科学工程LAMOST项目为背景,利用一阶谓词逻辑作为天体光谱... 寻找未知的天文规律是人类探索宇宙奥妙所追求目标之一.利用关联规则来描述天体光谱数据特征与其物理化学性质之间存在的、未知的相关性,是实现该目标的一种有效手段.以国家重大科学工程LAMOST项目为背景,利用一阶谓词逻辑作为天体光谱知识表示技术,提出一种约束FP树及其构造算法,从而有效提高天体光谱数据相关性分析的针对性和效率.并在此基础上,提出一种基于约束FP树的天体光谱数据相关性分析方法.实验结果分析表明,利用该相关性分析方法挖掘天体光谱数据特征和物理化学性质之间存在的相关性,是可行的和有价值的. 展开更多
关键词 天体光谱数据 相关性分析 关联规则 约束FP树 天体光谱知识
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部