期刊文献+
共找到83篇文章
< 1 2 5 >
每页显示 20 50 100
Research and Application on Web Information Retrieval Based on Improved FP-Growth Algorithm 被引量:3
1
作者 JIAO Minghai YAN Ping JIANG Huiyan 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1065-1068,共4页
A kind of single linked lists named aggregative chain is introduced to the algorithm, thus improving the architecture of FP tree. The new FP tree is a one-way tree and only the pointers that point its parent at each n... A kind of single linked lists named aggregative chain is introduced to the algorithm, thus improving the architecture of FP tree. The new FP tree is a one-way tree and only the pointers that point its parent at each node are kept. Route information of different nodes in a same item are compressed into aggregative chains so that the frequent patterns will be produced in aggregative chains without generating node links and conditional pattern bases. An example of Web key words retrieval is given to analyze and verify the frequent pattern algorithm in this paper. 展开更多
关键词 data mining CHAINS fp-growth algorithm frequent pattern aggregative information retrieval
在线阅读 下载PDF
A New Algorithm for Mining Frequent Pattern 被引量:2
2
作者 李力 靳蕃 《Journal of Southwest Jiaotong University(English Edition)》 2002年第1期10-20,共11页
Mining frequent pattern in transaction database, time series databases, and many other kinds of databases have been studied popularly in data mining research. Most of the previous studies adopt Apriori like candidat... Mining frequent pattern in transaction database, time series databases, and many other kinds of databases have been studied popularly in data mining research. Most of the previous studies adopt Apriori like candidate set generation and test approach. However, candidate set generation is very costly. Han J. proposed a novel algorithm FP growth that could generate frequent pattern without candidate set. Based on the analysis of the algorithm FP growth, this paper proposes a concept of equivalent FP tree and proposes an improved algorithm, denoted as FP growth * , which is much faster in speed, and easy to realize. FP growth * adopts a modified structure of FP tree and header table, and only generates a header table in each recursive operation and projects the tree to the original FP tree. The two algorithms get the same frequent pattern set in the same transaction database, but the performance study on computer shows that the speed of the improved algorithm, FP growth * , is at least two times as fast as that of FP growth. 展开更多
关键词 data mining algorithm frequent pattern set FP growth
在线阅读 下载PDF
A Novel Incremental Mining Algorithm of Frequent Patterns for Web Usage Mining 被引量:1
3
作者 DONG Yihong ZHUANG Yueting TAI Xiaoying 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期777-782,共6页
Because data warehouse is frequently changing, incremental data leads to old knowledge which is mined formerly unavailable. In order to maintain the discovered knowledge and patterns dynamically, this study presents a... Because data warehouse is frequently changing, incremental data leads to old knowledge which is mined formerly unavailable. In order to maintain the discovered knowledge and patterns dynamically, this study presents a novel algorithm updating for global frequent patterns-IPARUC. A rapid clustering method is introduced to divide database into n parts in IPARUC firstly, where the data are similar in the same part. Then, the nodes in the tree are adjusted dynamically in inserting process by "pruning and laying back" to keep the frequency descending order so that they can be shared to approaching optimization. Finally local frequent itemsets mined from each local dataset are merged into global frequent itemsets. The results of experimental study are very encouraging. It is obvious from experiment that IPARUC is more effective and efficient than other two contrastive methods. Furthermore, there is significant application potential to a prototype of Web log Analyzer in web usage mining that can help us to discover useful knowledge effectively, even help managers making decision. 展开更多
关键词 incremental algorithm association rule frequent pattern tree web usage mining
在线阅读 下载PDF
基于FP-Growth的目标编队规律挖掘模型
4
作者 徐秋坪 孙耀宗 《系统工程与电子技术》 北大核心 2025年第5期1620-1626,共7页
面向目标间编队协同作战运用规律分析挖掘需求,考虑目标编队样本存在一型多架、同类样本目标关联顺序不同等特征,提出一种基于频繁模式树的编队协同规律挖掘算法模型。模型中设计样本格式化预处理方法和频繁项分拣策略,运用频繁模式增... 面向目标间编队协同作战运用规律分析挖掘需求,考虑目标编队样本存在一型多架、同类样本目标关联顺序不同等特征,提出一种基于频繁模式树的编队协同规律挖掘算法模型。模型中设计样本格式化预处理方法和频繁项分拣策略,运用频繁模式增长算法挖掘目标编组规律知识,从编组运用样式、作战运用样式等维度分析典型编队规律运用特征。该模型易于工程实现,能够基于积累的编队样本数据,挖掘形成典型目标协同作战运用规律知识,通过案例分析介绍该模型的可行性和有效性,可为实时战场编队识别研判、目标态势变化趋势预测、临机动态规划等作战应用提供高价值情报支撑。 展开更多
关键词 编队规律 作战运用特征 频繁模式增长算法
在线阅读 下载PDF
结合FP-Growth与HMM模型的音乐信息类型划分方法研究
5
作者 武玉婷 《微型电脑应用》 2025年第3期127-129,133,共4页
针对传统音乐信息分类效率低和准确率差的情况,提出一种音乐信息类型划分模型。所提模型利用频繁模式增长算法挖掘音乐信息类型的关联度,并结合了隐马尔科夫模型构建分类模型。结果表明,分类模型在音乐信息分类中平均耗时为75.3 s,同时... 针对传统音乐信息分类效率低和准确率差的情况,提出一种音乐信息类型划分模型。所提模型利用频繁模式增长算法挖掘音乐信息类型的关联度,并结合了隐马尔科夫模型构建分类模型。结果表明,分类模型在音乐信息分类中平均耗时为75.3 s,同时对6种音乐分类的平均准确率达88.73%。在不同节奏特征向量与方法的比较中,分类准确率平均值分别为91.82%和92.63%,性能优于其他方法。这说明所提模型不仅提高了分类效率和精确度,还有助于推动音乐推荐、搜索等应用的进步。 展开更多
关键词 频繁模式增长算法 隐马尔科夫模型 音乐信息 分类
在线阅读 下载PDF
负载均衡的FP-growth并行算法研究 被引量:10
6
作者 曾志勇 杨呈智 陶冶 《计算机工程与应用》 CSCD 北大核心 2010年第4期125-126,229,共3页
针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证... 针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证明,该算法可以完整高效地挖掘频繁模式,并且实现均衡负载。 展开更多
关键词 数据挖掘 并行算法 FP—growth 频繁模式
在线阅读 下载PDF
基于Spark的并行FP-Growth算法优化与实现 被引量:8
7
作者 陆可 桂伟 +1 位作者 江雨燕 杜萍萍 《计算机应用与软件》 2017年第9期273-278,共6页
频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集... 频繁模式挖掘作为模式识别的重要问题,一直受到研究者的广泛关注。FP-Growth算法因其高效快速的特点,被大量应用于频繁模式的挖掘任务中。然而,该算法依赖于内存运行的特性,使其难以适应大规模数据计算。针对上述问题,围绕大规模数据集下频繁模式挖掘展开研究,基于Spark框架,通过对支持度计数和分组过程的优化改进了FP-Growth算法,并实现了算法的分布式计算和计算资源的动态分配。运算过程中产生的中间结果均保存在内存中,因此有效减少数据的I/O消耗,提高算法的运行效率。实验结果表明,经优化后的算法在面向大规模数据时要优于传统的FP-Growth算法。 展开更多
关键词 频繁模式挖掘 fp-growth算法 分布式计算 Spark框架
在线阅读 下载PDF
一种优化FP-growth的支持度相同项的排序算法 被引量:1
8
作者 武丽芬 《网络新媒体技术》 2012年第4期53-56,共4页
Han等人提出了频繁模式增长FP-growth算法,该算法在第一次扫描数据库后,得到频繁项集合和每个频繁项的支持度,并按支持度降序排列,但没有对支持度相同项的排列做进一步说明。本文依据"越是频繁出现,越可能被共享"的建树原则,... Han等人提出了频繁模式增长FP-growth算法,该算法在第一次扫描数据库后,得到频繁项集合和每个频繁项的支持度,并按支持度降序排列,但没有对支持度相同项的排列做进一步说明。本文依据"越是频繁出现,越可能被共享"的建树原则,提出了通过比较该项与前后项项集的支持度,较大者先排列的方法,使后续构建的FP-tree比任意排序构建的FP-tree更优。 展开更多
关键词 FP—growth算法 频繁项 项前缀子树 最小支持度
在线阅读 下载PDF
基于改进FP-growth算法的食品风险因素关联分析方法
9
作者 于家斌 马欣玥 +5 位作者 赵峙尧 王小艺 张新 崔晓玉 白玉廷 陈帅祥 《食品科学》 EI CAS CSCD 北大核心 2024年第23期250-258,共9页
为解决传统食品安全监督抽检“随机抽”模式存在的抽检决策主观性强、靶向性不高的问题,本研究提出一种基于改进Frequent Pattern-growth(FP-growth)算法的食品风险因素关联分析方法。首先,采用熵权法分别对食品种类的风险指标进行权重... 为解决传统食品安全监督抽检“随机抽”模式存在的抽检决策主观性强、靶向性不高的问题,本研究提出一种基于改进Frequent Pattern-growth(FP-growth)算法的食品风险因素关联分析方法。首先,采用熵权法分别对食品种类的风险指标进行权重分配,以计算出不同食品种类的风险指数。其次,以风险指数为特征,基于小批量K均值算法(MiniBatchKmeans)进行风险聚类,得到食品的风险等级。最后,采用带约束的改进FP-growth算法进行食品风险因素关联规则挖掘,挖掘食品风险等级与食品种类、时间、地域属性信息之间的关联关系,并对挖掘出的结果进行关联分析,从而为精准靶向引导抽检决策提供指导。本研究依托2019年中国某些地区的食品抽检数据进行分析,对其进行指标赋权,计算风险指数;后经过风险聚类为低风险、中风险和高风险;最后,将数据导入改进FPgrowth算法,得到食品风险因素关联规则。通过对比实验得到结果:对于17214条抽检数据,本研究提出的改进FP-growth算法相较于Apriori算法运行时间短;相较于传统FP-growth算法,删除了无效规则,提高了对食品风险因素关联规则的分析效率,从而为食品监管部门抽检工作提供了准确、高效的决策依据。 展开更多
关键词 食品安全监督抽检 关联分析 熵权法 MinibatchKmeans聚类 frequent pattern-growth算法
在线阅读 下载PDF
基于Spark的并行FP-Growth算法优化及实现 被引量:10
10
作者 顾军华 武君艳 +2 位作者 许馨匀 谢志坚 张素琪 《计算机应用》 CSCD 北大核心 2018年第11期3069-3074,共6页
为了进一步提高在Spark平台上的频繁模式增长(FP-Growth)算法执行效率,提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先,从频繁模式树(FP-Tree)规模大小和分区计算量对F-List分组策略进行改进,保证每个分区负载总和近似相等;然... 为了进一步提高在Spark平台上的频繁模式增长(FP-Growth)算法执行效率,提出一种新的基于Spark的并行FP-Growth算法——BFPG。首先,从频繁模式树(FP-Tree)规模大小和分区计算量对F-List分组策略进行改进,保证每个分区负载总和近似相等;然后,通过创建列表P-List对数据集划分策略进行优化,减少遍历次数,降低时间复杂度。实验结果表明,BFPG算法提高了并行FP-Growth算法挖掘效率,且算法具有良好的扩展性。 展开更多
关键词 大数据平台 关联规则 频繁项集 频繁模式增长算法 SPARK
在线阅读 下载PDF
一种改进的FP-Growth关联规则挖掘算法 被引量:2
11
作者 尤磊 辛大欣 石云平 《国外电子测量技术》 2007年第5期22-25,共4页
挖掘频繁项目集是关联规则挖掘中的重点之一。Jiawei Han等人提出了FP-Growth算法,该算法不产生候选项目集。但当数据库较大时,生成PT-Tree需遍历的树的节点数目很多。本文通过对FP-Growth算法分析,提出的改进算法能有效地减少需遍历的... 挖掘频繁项目集是关联规则挖掘中的重点之一。Jiawei Han等人提出了FP-Growth算法,该算法不产生候选项目集。但当数据库较大时,生成PT-Tree需遍历的树的节点数目很多。本文通过对FP-Growth算法分析,提出的改进算法能有效地减少需遍历的树的节点数,从而降低了时间开销。实验结果表明,改进算法能够比较明显地提高挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁项集 fp-growth算法 FP-tree
在线阅读 下载PDF
基于快速模式增长的FP-growth改进算法 被引量:1
12
作者 党敏侠 孟德鑫 《指挥信息系统与技术》 2012年第4期73-76,共4页
FP-growth算法是当前一种高效的频繁模式挖掘算法,分析了FP-growth算法的性能消耗,引入了条件频度基的数据结构用于存储构建条件FP-tree的所有频度信息,提出了自顶向下与自底向上结合的模式增长方法,该方法避免了原算法在遍历FP-tree时... FP-growth算法是当前一种高效的频繁模式挖掘算法,分析了FP-growth算法的性能消耗,引入了条件频度基的数据结构用于存储构建条件FP-tree的所有频度信息,提出了自顶向下与自底向上结合的模式增长方法,该方法避免了原算法在遍历FP-tree时的性能浪费。试验表明,运用了快速模式增长的改进算法的效率比原算法显著提高。 展开更多
关键词 频繁模式挖掘 fp-growth算法 条件频度基 模式增长
在线阅读 下载PDF
FP-Growth关联规则挖掘的改进算法 被引量:2
13
作者 张星 李蓓 《平顶山工学院学报》 2008年第1期21-24,共4页
文章通过对FP-Growth算法分析,提出的改进算法能有效地减少需遍历的树的节点数,从而降低了时间开销。实验表明:改进算法能明显地提高挖掘效率。
关键词 关联规则 FP—growth算法 FP—tree 数据挖掘
在线阅读 下载PDF
关联规则算法FP-growth的研究与分析 被引量:4
14
作者 侯长满 余彪 《计算机与网络》 2016年第24期58-61,共4页
FP-growth算法是关联规则挖掘中应用最为广泛的挖掘算法,与经典算法Apriori算法最大的区别是不需要挖掘候选集,所以在挖掘效率上有了很大的提升,但是在构建模式树FP-tree时是基于整个事务数据库的,当遇到大型数据库或挖掘约束条件严格时... FP-growth算法是关联规则挖掘中应用最为广泛的挖掘算法,与经典算法Apriori算法最大的区别是不需要挖掘候选集,所以在挖掘效率上有了很大的提升,但是在构建模式树FP-tree时是基于整个事务数据库的,当遇到大型数据库或挖掘约束条件严格时,算法执行过程中占用内存较大,对空间要求较高,且是递归调用,执行效率不高。在对FP-growth算法研究的基础上提出了一种改进算法,该算法改变FP-tree结构,将一棵FP-tree分为多条子树进行频繁模式的挖掘,减少了内存的占用,提高了算法的执行效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 FP—growth算法
在线阅读 下载PDF
基于FP-GROWTH算法的关联规则挖掘算法研究 被引量:3
15
作者 陈寅 《无线互联科技》 2017年第19期118-121,124,共5页
互联网世界的数据每年都在成倍增长,但是对用户有用的信息却好像在减少,用户淹没在数据的海洋中,虽然类似于Google这样的搜索引擎可以帮用户找到需要的信息,但是正确率和查全率都不尽如人意。数据挖掘是兴起于20世纪90年代的一项用于决... 互联网世界的数据每年都在成倍增长,但是对用户有用的信息却好像在减少,用户淹没在数据的海洋中,虽然类似于Google这样的搜索引擎可以帮用户找到需要的信息,但是正确率和查全率都不尽如人意。数据挖掘是兴起于20世纪90年代的一项用于决策支持的新技术。FP-GROWTH算法只进行2次数据库扫描。它不使用侯选集,直接压缩数据库成一个频繁模式树,最后通过这棵树生成关联规则。文章研究FP-GROWTH算法理论的同时实现了一个简单算法演示的系统。系统包括算法的执行,对数据库的修改、查询、删除的操作。最后,对FP-GROWTH算法和Apriori算法进行了比较。 展开更多
关键词 数据挖掘 关联规则 fp-growth算法 候选集 频繁模式树
在线阅读 下载PDF
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
16
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 FP—growth算法 FP—tree
在线阅读 下载PDF
基于FP-tree的快速挖掘全局最大频繁项集算法 被引量:2
17
作者 何波 《计算机集成制造系统》 EI CSCD 北大核心 2011年第7期1547-1552,共6页
挖掘最大频繁项集的算法多基于局部数据库,为此提出了一种基于频繁模式树的快速挖掘全局最大频繁项集算法。该算法首先挖掘出所有全局频繁项目组成集合,然后各个节点根据该集合构建局部频繁模式树,最后将该集合作为全局最大频繁候选项集... 挖掘最大频繁项集的算法多基于局部数据库,为此提出了一种基于频繁模式树的快速挖掘全局最大频繁项集算法。该算法首先挖掘出所有全局频繁项目组成集合,然后各个节点根据该集合构建局部频繁模式树,最后将该集合作为全局最大频繁候选项集,采用自顶向下策略挖掘出所有的全局最大频繁项集。与类Apriori算法相比,该算法采用的频繁模式树结构能大幅度降低数据库扫描次数和运行时间;自顶向下的策略能大幅度减少候选项集数和通信量。实验结果表明,该算法是快速和高效的。 展开更多
关键词 数据挖掘 频繁模式树 全局最大频繁项集 算法
在线阅读 下载PDF
基于FP-Growth算法构建乳腺癌放疗相关放射性皮炎预测模型的研究
18
作者 杨阳 崔玲 田龙 《国际放射医学核医学杂志》 2026年第1期26-34,共9页
目的基于频繁模式增长(FP-Growth)算法构建乳腺癌放疗相关放射性皮炎(RD)的预测模型,并评估其对急性RD与晚期RD的预测效能,为临床RD风险预警提供参考。方法回顾性分析2010年1月至2024年1月河北北方学院附属第一医院收治的1000例接受乳... 目的基于频繁模式增长(FP-Growth)算法构建乳腺癌放疗相关放射性皮炎(RD)的预测模型,并评估其对急性RD与晚期RD的预测效能,为临床RD风险预警提供参考。方法回顾性分析2010年1月至2024年1月河北北方学院附属第一医院收治的1000例接受乳腺癌改良根治术后放疗的女性患者[年龄(50.6±18.4)岁]的临床资料。采用简单随机抽样法将患者分为建模组和验证组。采用FP-Growth算法对建模组患者基线资料进行关联规则分析,构建急性RD与晚期RD预测模型。采用一致性指数(CI)、校准曲线进行模型内部验证。采用受试者工作特征(ROC)曲线下面积(AUC)进行模型外部验证。计数资料的组间比较采用χ^(2)检验,等级资料的组间比较采用Wilcoxon秩和检验。采用Delong检验比较建模组与验证组AUC的差异,采用Hosmer-Lemeshow检验评价ROC曲线的拟合优度。结果建模组512例、验证组488例。RD预测模型最终筛选出2条有效强关联规则。(1)急性RD的有效强关联规则组合:体重指数(≥35 kg/m^(2))、肿瘤大小(4~5 cm)、有化疗史及白蛋白水平(<35 g/L),急性RD发生率为79%;(2)晚期RD的有效强关联规则组合:年龄(60~69岁)、卡氏功能状态评分(<70分)、有化疗史、有糖尿病病史、白蛋白水平(<35 g/L),晚期RD发生率为69%。内部验证结果显示,RD预测模型预测建模组患者急性RD、晚期RD的CI分别为0.863(95%CI:0.646~0.932,P=0.011)、0.812(95%CI:0.669~0.892,P=0.023);校准曲线显示,该模型预测概率与实际概率的一致性较好。外部验证结果显示,模型预测建模组、验证组急性RD的AUC分别为0.882、0.876,差异无统计学意义(Z=0.334,P=0.205);预测晚期RD的AUC分别为0.673、0.668,差异无统计学意义(Z=0.982,P=0.092)。Hosmer-Lemeshow检验结果显示,急性RD、晚期RD的预测模型拟合均良好(χ^(2)=4.921、5.039,P=0.125、0.327)。结论基于FP-Growth算法构建的RD预测模型对急性RD和晚期RD的预测效能均能够满足临床要求,可为乳腺癌放疗相关RD的风险预警与临床干预提供参考。 展开更多
关键词 乳腺肿瘤 放射性皮炎 预测 频繁模式增长算法 急性 晚期
原文传递
基于FP_Growth算法的关联规则挖掘研究及应用 被引量:7
19
作者 马瑞敏 吴海霞 《太原师范学院学报(自然科学版)》 2021年第1期19-22,共4页
关联规则的发现对于挖掘数据中的隐含信息非常重要,针对关联规则挖掘算法进行研究,分析了利用FP_Growth算法构建FP-tree和递归挖掘频繁项集的过程,并应用该算法对大学生兴趣爱好问卷调查结果进行分析,通过找出强关联规则,准确了解学生... 关联规则的发现对于挖掘数据中的隐含信息非常重要,针对关联规则挖掘算法进行研究,分析了利用FP_Growth算法构建FP-tree和递归挖掘频繁项集的过程,并应用该算法对大学生兴趣爱好问卷调查结果进行分析,通过找出强关联规则,准确了解学生的共同爱好,有助于更好地开展校园文化活动. 展开更多
关键词 关联规则 频繁项集 FP_growth算法 FP-tree 条件模式基
在线阅读 下载PDF
基于FP-tree目录分割自适应算法
20
作者 陆楠 杜文峰 梁正平 《深圳大学学报(理工版)》 EI CAS 北大核心 2011年第4期341-346,共6页
研究面向顾客的商业智能目录分割问题,要求顾客对收到的目录至少有兴趣度t,并评估满足最小兴趣度的顾客数量.为优化评估效果,构建频繁模式树结构FP-tree存储顾客数据库,给出MCC-CS算法解决目录分割问题,该算法使用树深度遍历法选择目录... 研究面向顾客的商业智能目录分割问题,要求顾客对收到的目录至少有兴趣度t,并评估满足最小兴趣度的顾客数量.为优化评估效果,构建频繁模式树结构FP-tree存储顾客数据库,给出MCC-CS算法解决目录分割问题,该算法使用树深度遍历法选择目录产品.经验证,该算法能够获得更好的商业目标. 展开更多
关键词 数据挖掘 目录分割 顾客覆盖 频繁模式树 自适应算法
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部