期刊文献+
共找到329篇文章
< 1 2 17 >
每页显示 20 50 100
基于FP-Growth算法和贝叶斯模型的坍塌事故致因分析
1
作者 李珏 曾敏 《武汉理工大学学报(信息与管理工程版)》 2026年第1期15-21,共7页
为探究建筑施工安全风险,深入分析建筑工程中的坍塌事故风险,通过改进的人因分析和分类系统(HFACS)模型识别出32个坍塌事故的关键致因。同时为深入挖掘事故特征,明确施工坍塌事故的成因机制,采用基于FP-Growth算法的关联规则挖掘方法构... 为探究建筑施工安全风险,深入分析建筑工程中的坍塌事故风险,通过改进的人因分析和分类系统(HFACS)模型识别出32个坍塌事故的关键致因。同时为深入挖掘事故特征,明确施工坍塌事故的成因机制,采用基于FP-Growth算法的关联规则挖掘方法构建贝叶斯网络结构,通过数据驱动的方式训练模型,从而提升坍塌事故推理分析的效率与精度。基于贝叶斯网络的敏感性分析与逆向推理,识别出5类坍塌事故的关键致因及其致因路径。研究结果表明:土方坍塌、建筑物坍塌、拆除工程坍塌和模板坍塌多由不安全行为前提条件造成,脚手架坍塌多由不安全行为前提条件和不安全行为共同造成。通过关键致因链分析可知5类坍塌事故的发生路径,从而对各类事故进行管控。 展开更多
关键词 fp-GROWTH算法 贝叶斯网络 HFACS模型 风险分析 关联规则
在线阅读 下载PDF
基于FP-growth算法与贝叶斯网络的冲击地压事故致因分析
2
作者 欧阳振华 肖曼曼 +2 位作者 刘建 许乾海 鞠成润 《华北科技学院学报》 2026年第1期106-116,共11页
为克服传统方法在分析冲击地压多因素耦合致灾方面的不足,精准解析该灾害的致因逻辑并实现风险前置管控,本文以2001-2024年间56份权威事故调查报告为样本,利用FP-growth算法对非结构化文本进行挖掘,通过支持度-置信度-提升度三维过滤机... 为克服传统方法在分析冲击地压多因素耦合致灾方面的不足,精准解析该灾害的致因逻辑并实现风险前置管控,本文以2001-2024年间56份权威事故调查报告为样本,利用FP-growth算法对非结构化文本进行挖掘,通过支持度-置信度-提升度三维过滤机制提取高频共现致因;继而融合挖掘结果与领域知识,构建具备先验-后验动态更新能力的贝叶斯网络拓扑,实现致因链的概率推理与风险反演。揭示了“地质-开采-管理”因素耦合的非线性致灾规律,定量识别出煤岩冲击倾向性、地质构造、开采深度等地质因素的主导作用,以及采掘扰动、煤柱等开采因素的关键触发效应,同时明确了安全意识不足等管理因素的风险放大作用。基于量化分析结果,提出了针对性的冲击地压风险前置管控措施,为煤矿企业优化开采方案与精准部署卸压监测工程提供了科学依据,可推动冲击地压防治由经验驱动向数据-知识协同驱动转型。 展开更多
关键词 冲击地压 致灾因素 fp-GROWTH算法 贝叶斯网络 关联关系
在线阅读 下载PDF
Research and Application on Web Information Retrieval Based on Improved FP-Growth Algorithm 被引量:3
3
作者 JIAO Minghai YAN Ping JIANG Huiyan 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1065-1068,共4页
A kind of single linked lists named aggregative chain is introduced to the algorithm, thus improving the architecture of FP tree. The new FP tree is a one-way tree and only the pointers that point its parent at each n... A kind of single linked lists named aggregative chain is introduced to the algorithm, thus improving the architecture of FP tree. The new FP tree is a one-way tree and only the pointers that point its parent at each node are kept. Route information of different nodes in a same item are compressed into aggregative chains so that the frequent patterns will be produced in aggregative chains without generating node links and conditional pattern bases. An example of Web key words retrieval is given to analyze and verify the frequent pattern algorithm in this paper. 展开更多
关键词 data mining CHAINS fp-growth algorithm frequent pattern aggregative information retrieval
在线阅读 下载PDF
基于优化FP⁃Growth算法的滑坡频繁因素组合挖掘 被引量:1
4
作者 李佳颖 郝彬超 +4 位作者 王卫东 王智超 曹禄来 韩征 朱崇政 《防灾减灾工程学报》 北大核心 2025年第3期532-541,共10页
滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方... 滑坡影响因素复杂多样,挖掘滑坡的频繁因素组合能宏观快速地初步判识滑坡易发区域。以四川省凉山彝族自治州内586处滑坡灾害为样本数据,从地质条件、水文条件、地形条件、气象条件和人类工程活动五个方面收集12个滑坡影响因素,基于卡方检验剔除与滑坡灾害弱相关的影响因素,耦合分析滑坡区域与影响因素区划,针对大数据挖掘算法仅能以历史滑坡次数等离散型变量为挖掘依据的局限性,引入特征参数优化频繁模式树(FPGrowth)算法,使其能以历史滑坡面积和历史滑坡密度等连续型变量为挖掘依据,挖掘滑坡频繁二级因素组合,利用卡方检验与频率比检验挖掘结果准确性。结果表明:基于历史滑坡密度的优化关联规则算法能更好地挖掘滑坡频繁二级因素组合,其中,“高程<1769 m、地表起伏度62~140 m”的区域滑坡最频繁,需要对滑坡灾害重点关注与防治。针对原始关联规则算法仅能以滑坡次数为挖掘依据的局限,优化算法以考虑滑坡范围的影响,深入研究多种影响因素对滑坡的综合作用,为滑坡灾害的快速判识与防灾减灾提供参考。 展开更多
关键词 大数据挖掘技术 优化关联规则算法 fp-GROWTH算法 滑坡影响因素 频繁组合挖掘
原文传递
FP-Growth算法在校园二手商品推荐系统中的应用
5
作者 秦彦悦 安尘潇 +3 位作者 李云 张兆洋 丁勇 吴许俊 《计算机时代》 2025年第5期35-39,共5页
本文探讨了FP-Growth算法在高校二手交易系统中的应用。通过分析校园二手交易记录,设计基于FP-Growth算法的商品推荐算法,使推荐内容更贴合校园环境需求。算法基于Java技术栈设计并实现,能够有效挖掘学生交易数据中的频繁项集,生成适用... 本文探讨了FP-Growth算法在高校二手交易系统中的应用。通过分析校园二手交易记录,设计基于FP-Growth算法的商品推荐算法,使推荐内容更贴合校园环境需求。算法基于Java技术栈设计并实现,能够有效挖掘学生交易数据中的频繁项集,生成适用于校园场景的商品推荐关联规则。 展开更多
关键词 fp-GROWTH算法 校园二手交易 关联规则 商品推荐
在线阅读 下载PDF
基于FP-Growth算法的露天煤矿无人驾驶车辆故障预警分析与应用效果研究 被引量:1
6
作者 姜文鑫 韩硕 +1 位作者 甘宏 辛守辉 《煤矿机械》 2025年第5期187-190,共4页
目前,露天煤矿无人驾驶车辆主要依靠5G专网和设备进行集成,一旦通信网络出现故障,则会严重影响露天煤矿无人驾驶车辆智能化运行。为及时发现露天煤矿无人驾驶车辆无线通信网络故障并予以解决,以FP-Growth算法为基础,配合萤火虫算法,对... 目前,露天煤矿无人驾驶车辆主要依靠5G专网和设备进行集成,一旦通信网络出现故障,则会严重影响露天煤矿无人驾驶车辆智能化运行。为及时发现露天煤矿无人驾驶车辆无线通信网络故障并予以解决,以FP-Growth算法为基础,配合萤火虫算法,对无线通信网络故障节点进行全自动定位。实验结果表明,与传统算法相比,该方法可实现露天煤矿无人驾驶车辆无线通信故障节点定位,从而更加快速地对车辆故障进行识别和预警。 展开更多
关键词 露天煤矿 无人驾驶车辆 fp-GROWTH算法 萤火虫算法 无线通信故障
原文传递
基于FP-Growth算法的地面气象观测数据异常挖掘
7
作者 许烨 牛淑丽 狄增文 《气象水文海洋仪器》 2025年第1期33-36,共4页
为了提高对地面气象观测集合中异常数据的精准检测与识别能力,文章提出基于FP-Growth算法的地面气象观测数据异常挖掘方法。设定数据采集频率,根据观测需求确定数据采集的时间间隔,进行采样地面气象观测数据的整合;引进FP-Growth算法,基... 为了提高对地面气象观测集合中异常数据的精准检测与识别能力,文章提出基于FP-Growth算法的地面气象观测数据异常挖掘方法。设定数据采集频率,根据观测需求确定数据采集的时间间隔,进行采样地面气象观测数据的整合;引进FP-Growth算法,基于FP-Tree结构,筛选频繁项,进行观测数据特征的提取;对于数据集中的每个点,计算与其最近邻的距离,根据距离定义异常分数,实现异常数据挖掘与聚类。实验结果表明:设计方法挖掘的观测数据异常量与实际样本数据的数量一致,说明该方法在实际应用中,可以实现对地面气象观测数据异常的精准挖掘。 展开更多
关键词 fp-GROWTH算法 挖掘方法 异常 观测数据 气象 地面
在线阅读 下载PDF
基于改进FP-growth的多品类打包推荐算法
8
作者 李雄清 李永 +6 位作者 王骏飞 臧凌 刘德志 卞宇轩 柴阅林 李卓潇 刘云韬 《网络安全与数据治理》 2025年第3期47-53,共7页
多品类打包推荐是现代推荐系统中的重要任务,旨在通过组合不同类别的产品,向用户进行一站式推荐,以满足用户的多样化需求并提升用户体验。目前,该任务面临即时响应需求高、数据规模庞大、数据稀疏性高等挑战,现有打包算法难以应对。为... 多品类打包推荐是现代推荐系统中的重要任务,旨在通过组合不同类别的产品,向用户进行一站式推荐,以满足用户的多样化需求并提升用户体验。目前,该任务面临即时响应需求高、数据规模庞大、数据稀疏性高等挑战,现有打包算法难以应对。为解决上述问题,提出了一种基于改进FP-growth算法的多品类打包推荐算法,即在FP-growth算法的基础上,对产品属性间的关联关系进行挖掘,并根据属性关联规则匹配出符合度最高的打包产品,有效缓解了产品间的数据稀疏性问题。在基于航空旅游零售领域的数据集上,本方法相较于基准方法显著提高了打包质量和打包效率。 展开更多
关键词 多品类打包 推荐系统 关联规则挖掘 fp-GROWTH算法 航空旅游零售
在线阅读 下载PDF
基于FP-growth算法的陈寿菲治疗慢性胃炎脾虚湿热证方药规律挖掘及经验特色研究
9
作者 陈洋 胡海金 陈寿菲 《中国医药指南》 2025年第30期152-155,共4页
目的为探明陈寿菲主任辨治脾虚湿热证的患者的临床表现及用药特点。方法以2023年1月至2023年12月就诊于福州市第二总医院中医科陈寿菲主任门诊,诊断为“胃脘痛”“胃痞病”脾虚湿热证的病历资料480例。基于FP-growth的算法,构建症状-证... 目的为探明陈寿菲主任辨治脾虚湿热证的患者的临床表现及用药特点。方法以2023年1月至2023年12月就诊于福州市第二总医院中医科陈寿菲主任门诊,诊断为“胃脘痛”“胃痞病”脾虚湿热证的病历资料480例。基于FP-growth的算法,构建症状-证型-药物关联规则。结果陈皮、白术、茯苓、木香、姜半夏、厚朴、薏苡仁、黄连、甘草为脾虚湿热证核心药物,嗳气、苔黄腻、脉沉细为脾虚湿热证的最常见的症状,胃脘疼痛、胃脘胀满、腹痛、乏力、口干、口苦、反酸、嗳气、纳呆、便溏、舌质淡红、舌质暗红、中有裂纹、边有齿印、苔黄腻、苔根腻、苔薄黄、苔腻微黄、脉细、脉弦、脉细弦、脉沉细为脾虚湿热证患者常见证候群,对应“木香-甘草-白术-茯苓-陈皮”组合置信度达92.71%,为脾虚湿热证患者的核心用药。结论脾虚湿热证作为一种兼夹证型在福建地区较为多见,本研究通过数据挖掘展示脾虚湿热证的临床表现,以及“健脾清化法”核心用药及用药加减依据;揭示了“健脾清化法”用的药内在逻辑。并以数据支撑症状-证型-中药三者之间内在逻辑,为名老中医经验传承提供结构化路径。 展开更多
关键词 慢性胃炎 脾虚湿热证 fp-GROWTH算法 方证相应 数据挖掘
暂未订购
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
10
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 fp—growth算法 fp—tree
在线阅读 下载PDF
基于布尔矩阵和MapReduce的FP-Growth算法 被引量:23
11
作者 陈兴蜀 张帅 +1 位作者 童浩 崔晓靖 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第1期135-141,共7页
关联规则挖掘是数据挖掘的一个重要组成部分.为提高关联规则的挖掘效率,提出了一种基于布尔矩阵和MapReduce的FP-Growth算法(BPFP),分析了算法的时间和空间复杂度.该算法使用Hadoop框架和布尔矩阵以减少对事务数据的扫描次数,利用两次Ma... 关联规则挖掘是数据挖掘的一个重要组成部分.为提高关联规则的挖掘效率,提出了一种基于布尔矩阵和MapReduce的FP-Growth算法(BPFP),分析了算法的时间和空间复杂度.该算法使用Hadoop框架和布尔矩阵以减少对事务数据的扫描次数,利用两次MapReduce来实现频繁项集的挖掘.在多个数据集上的实验结果表明,与原FP-Growth算法相比,BPFP算法具有更高的执行效率、更好的加速比. 展开更多
关键词 数据挖掘 关联规则 布尔矩阵 MAPREDUCE fp-GROWTH算法
在线阅读 下载PDF
基于负载均衡和冗余剪枝的并行FP-Growth算法 被引量:8
12
作者 刘祥哲 刘培玉 +2 位作者 任敏 伊静 高钊 《数据采集与处理》 CSCD 北大核心 2016年第1期223-230,共8页
针对现有的并行FP-Growth算法在数据并行分组时存在数据冗余和负载不均的问题,提出了基于负载估算和冗余剪枝的优化算法。首先,在采用高频策略分组时,引入节点任务估算方法,把每个分组中最大模式树的最长路径和支持度作为该分组的估计值... 针对现有的并行FP-Growth算法在数据并行分组时存在数据冗余和负载不均的问题,提出了基于负载估算和冗余剪枝的优化算法。首先,在采用高频策略分组时,引入节点任务估算方法,把每个分组中最大模式树的最长路径和支持度作为该分组的估计值,将估计值远大于其他节点的分组进行分割,平均到其他分组中,并且对不同分组中重复的列表元素进行截断,去除冗余数据。实验表明,本文提出的算法能够有效防止并行化的数据倾斜,减少数据冗余,在时间和空间复杂度上要低于以前的并行化FP-Growth算法。 展开更多
关键词 关联规则 MAPREDUCE 冗余剪枝 fp-GROWTH算法
在线阅读 下载PDF
基于FP-Growth的中医药数据关联分析平台的设计和应用 被引量:45
13
作者 杨涛 陆明 朱垚 《时珍国医国药》 CAS CSCD 北大核心 2016年第12期3050-3052,共3页
目的设计中医药数据关联分析平台,对名老中医诊治高血压病的医案进行分析,探索"病机-中药"之间的相关性。方法分析FP-Growth算法原理,设计基于FP-Growth的中医药关联分析软件XMiner,并对430诊次高血压医案进行分析。结果 XMi... 目的设计中医药数据关联分析平台,对名老中医诊治高血压病的医案进行分析,探索"病机-中药"之间的相关性。方法分析FP-Growth算法原理,设计基于FP-Growth的中医药关联分析软件XMiner,并对430诊次高血压医案进行分析。结果 XMiner能够完成中医医药数据清洗、格式转换、关联分析、依赖关系网络绘制等功能,从高血压医案中成功提取18条"病机-药物"规则,能够辅助解释名老中医用药规律。结论 XMiner能够较好地完成规则提取和展示,对中医药数据挖掘和知识发现具有一定的意义。在今后的研究中,要将多种方法融入平台中,建立多方法协同工作的中医药挖掘范式,为大数据时代的中医药传承与发展服务。 展开更多
关键词 中医药 关联分析 fp-GROWTH算法
原文传递
负载均衡的FP-growth并行算法研究 被引量:10
14
作者 曾志勇 杨呈智 陶冶 《计算机工程与应用》 CSCD 北大核心 2010年第4期125-126,229,共3页
针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证... 针对在大数据量频繁模式挖掘的时候,有效地利用空闲的计算资源,提出一种基于FP-growth算法的并行算法。该算法有效地将FP-growth主要的计算部分合理地分配到各个计算节点上,各个节点独立完成挖掘后返回结果,从而缩短总计算时间。实验证明,该算法可以完整高效地挖掘频繁模式,并且实现均衡负载。 展开更多
关键词 数据挖掘 并行算法 fp—growth 频繁模式
在线阅读 下载PDF
基于FP-network关联规则挖掘算法的配电网薄弱点分析研究 被引量:16
15
作者 程江洲 聂玮瑶 +3 位作者 张赟宁 谌桥 陈秋航 余子容 《电测与仪表》 北大核心 2021年第3期47-53,共7页
针对配电网运行时经常发生故障的情况,如何快速高效地寻找出配电网中的薄弱点成为了当下配电网安全运行的一大难题。文中采用频繁模式网络(FP-network)模型,建立事务-项目的关联矩阵,并且将所需要进行关联规则挖掘的数据储存在关联矩阵... 针对配电网运行时经常发生故障的情况,如何快速高效地寻找出配电网中的薄弱点成为了当下配电网安全运行的一大难题。文中采用频繁模式网络(FP-network)模型,建立事务-项目的关联矩阵,并且将所需要进行关联规则挖掘的数据储存在关联矩阵中,从而进行关联规则的数据挖掘。通过算例分析证实了FP-network关联规则挖掘算法可用于配电网薄弱点分析中,并通过配电网实际运行情况验证了该算法的可行性。该算法对配电网数据库中的故障数据仅仅需要进行一次扫描,从而提高了配电网故障数据关联规则挖掘的效率,更有利于配电网实时更新数据库,为分析检测配电网运行中的薄弱点提供了技术支持。 展开更多
关键词 薄弱点分析 数据挖掘 fp-TREE算法 fp-network算法 关联规则
在线阅读 下载PDF
基于FP-Tree的模式分解算法 被引量:6
16
作者 丛丹 王俊普 +1 位作者 杨文 张劭一 《计算机工程》 CAS CSCD 北大核心 2005年第16期77-79,88,共4页
提出了基于FP-Tree的PD算法。该算法将模式分解焦点从原始数据集转移到数据相对集中的FP-Tree上,从而进一步提高了PD算法挖掘频繁模式集的效率。文中以实例说明了该算法的工作过程。
关键词 数据挖掘 频繁模式树 模式分解算法
在线阅读 下载PDF
一种基于聚合链的改进FP-Growth算法 被引量:4
17
作者 焦明海 姜慧研 唐加福 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2006年第2期153-156,共4页
提出了一种基于聚合链挖掘频繁模式的改进FP-growth算法.该算法引入聚合链的单链表结构,改进了FP树结构.改进后的FP树是单向的,每个结点只保留指向父结点的指针,节省了树空间;相同项的不同节点的路径信息压缩进聚合链中,避免了生成节点... 提出了一种基于聚合链挖掘频繁模式的改进FP-growth算法.该算法引入聚合链的单链表结构,改进了FP树结构.改进后的FP树是单向的,每个结点只保留指向父结点的指针,节省了树空间;相同项的不同节点的路径信息压缩进聚合链中,避免了生成节点链和条件模式库.用Agrawa方法生成实验数据进行分析,实验结果验证了该算法在时间上的优势. 展开更多
关键词 数据挖掘 频繁模式 fp 聚合链 fp-GROWTH算法
在线阅读 下载PDF
基于FP-growth算法的高校群体性突发事件关联规则分析 被引量:14
18
作者 姬浩 苏兵 吕美 《中国安全科学学报》 CAS CSCD 北大核心 2012年第12期144-151,共8页
为有效预防高校群体性突发事件,借助数据挖掘关联规则挖掘理论,在分析高校突发事件关键诱发因素基础上,构建基于FP-growth算法的高校群体性突发事件关联规则挖掘模型。并将模型应用于事务数据库数据的分析中,研究关键诱发因素间关联关系... 为有效预防高校群体性突发事件,借助数据挖掘关联规则挖掘理论,在分析高校突发事件关键诱发因素基础上,构建基于FP-growth算法的高校群体性突发事件关联规则挖掘模型。并将模型应用于事务数据库数据的分析中,研究关键诱发因素间关联关系,实现强关联规则输出。研究结果表明,多数高校群体性突发事件的发生与日期没有必然联系;内部管理因素、内外部突发事件、内部突发事件、政治因素是诱发高校群体性突发事件的主要因素,且外部因素导致的群体性突发事件影响力远远超过内部因素的影响力;当突发事件发生后,应急处置的有效性是决定突发事件影响力的重要因素。 展开更多
关键词 高校安全 群体性突发事件 数据挖掘 fp-GROWTH算法 关联规则
原文传递
基于邻接矩阵的FP-tree构造算法 被引量:9
19
作者 刘应东 冷明伟 陈晓云 《计算机工程与应用》 CSCD 北大核心 2011年第7期153-155,共3页
提出了一种基于邻接矩阵的FP-tree构造方法。首先通过扫描数据库建立2-项集支持数的邻接矩阵,通过邻接矩阵对项进行过滤和新方式排序,然后再利用邻接矩阵构造FP-tree,使得FP-tree的分支、节点数和深度大幅度地减少,从而使存储空间减少... 提出了一种基于邻接矩阵的FP-tree构造方法。首先通过扫描数据库建立2-项集支持数的邻接矩阵,通过邻接矩阵对项进行过滤和新方式排序,然后再利用邻接矩阵构造FP-tree,使得FP-tree的分支、节点数和深度大幅度地减少,从而使存储空间减少、遍历时间缩短。最后使用标准数据集进行验证测试并和其他算法的比较,实验结果表明,该算法在保证结果的同时有效地提高频繁项集挖掘的效率。 展开更多
关键词 数据挖掘 频繁项集 fp-TREE算法 邻接矩阵
在线阅读 下载PDF
基于Spark框架的FP-Growth大数据频繁项集挖掘算法 被引量:13
20
作者 邵梁 何星舟 尚俊娜 《计算机应用研究》 CSCD 北大核心 2018年第10期2932-2935,共4页
针对大数据中的频繁项集挖掘问题,提出一种基于Spark框架的FP-Growth频繁项集并行挖掘算法。首先,根据垂直布局思想将数据按照事务标志符垂直排列,以此解决扫描整个数据集的缺陷;然后,通过FPGrowth算法构建频繁模式树,并生成频繁1-项集... 针对大数据中的频繁项集挖掘问题,提出一种基于Spark框架的FP-Growth频繁项集并行挖掘算法。首先,根据垂直布局思想将数据按照事务标志符垂直排列,以此解决扫描整个数据集的缺陷;然后,通过FPGrowth算法构建频繁模式树,并生成频繁1-项集;接着,通过扫描垂直数据集来计算项集的支持度,从而识别出非频繁项,并将其从数据集中删除以降低数据尺寸;最后,通过迭代过程来生成频繁k-项集。在标准数据集上的实验结果表明,该算法能够有效挖掘出频繁项集,在执行时间方面具有很大的优越性。 展开更多
关键词 大数据 频繁项集挖掘 Spark框架 fp-GROWTH算法 垂直布局
在线阅读 下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部