期刊文献+
共找到632篇文章
< 1 2 32 >
每页显示 20 50 100
基于C4.5决策树算法的调度规则挖掘与应用
1
作者 姜宏广 周谧 杨溢 《红水河》 2026年第1期1-5,共5页
针对水库群优化调度因模型“黑箱”特性导致决策逻辑不透明、实际采纳困难的问题,笔者提出一种“先优化、后挖掘”的数据驱动范式。以岷江—大渡河流域水库群为例,首先基于57年长系列多目标优化调度结果,构建包含水位、入库流量及预见... 针对水库群优化调度因模型“黑箱”特性导致决策逻辑不透明、实际采纳困难的问题,笔者提出一种“先优化、后挖掘”的数据驱动范式。以岷江—大渡河流域水库群为例,首先基于57年长系列多目标优化调度结果,构建包含水位、入库流量及预见期流量等特征的样本集;进而采用C4.5决策树算法,按月训练并提取出直观的“if-then”形式调度规则。结果表明:所提取规则能有效捕捉系统的主要调度逻辑;在枯水期可显著提升发电量,多数电站枯水期发电量增幅达0.39%~15.34%,全年发电量亦保持稳定或略有提高;同时,规则调度使下游高场站在90%、95%和98%保证率下的枯水期最小日流量虽略低于原优化结果,但差距极小。研究表明,基于C4.5决策树的规则挖掘方法,能够将复杂的数值优化方案转化为可理解、可验证、可执行的调度知识,在保障综合效益的前提下,显著提升了调度决策的可解释性与工程可信度,为水库群智能调度提供了具有实用价值的技术途径。 展开更多
关键词 水库调度 决策树 c4.5算法 调度规则挖掘 可解释性 岷江—大渡河流域
在线阅读 下载PDF
改进型C4.5算法在多波束点云自动消噪中的应用
2
作者 史俊明 卢清国 《海洋测绘》 北大核心 2025年第1期21-24,30,共5页
传统C4.5算法广泛应用于多波束测深系统中水深点与噪声点的自动分离,但是该算法中存在过拟合和属性相关性问题。为解决传统C4.5算法的缺陷,引入改进型C4.5算法,提出了通过计算属性依赖度更新数据集合的方法。首先通过点云之间的点特征... 传统C4.5算法广泛应用于多波束测深系统中水深点与噪声点的自动分离,但是该算法中存在过拟合和属性相关性问题。为解决传统C4.5算法的缺陷,引入改进型C4.5算法,提出了通过计算属性依赖度更新数据集合的方法。首先通过点云之间的点特征、区域特征、窗口特征等建立数据集合,并对连续特征属性进行离散化处理。然后构建决策树,利用信息增益率判断根节点(即确定最优属性划分),迭代更新,完成数据集合的分类,并对整体数据进行后剪枝处理。采用多种地形对本文算法训练效果进行交叉评定,证明本文算法的泛化能力和准确度较高。 展开更多
关键词 海洋测绘 多波束测深系统 改进型c4.5算法 信息增益率 属性依赖度 后剪枝
在线阅读 下载PDF
C4.5算法的优化 被引量:15
3
作者 黄秀霞 孙力 《计算机工程与设计》 北大核心 2016年第5期1265-1270,1361,共7页
对传统C4.5算法的运算效率和属性选择准确性进行研究,对其进行改进。运用泰勒级数和等价无穷小的原理对算法的计算公式进行简化,提高运算效率;在简化后的信息增益率计算公式中引入其它非类属性对于该属性的GINI指数的均值,用于调整因非... 对传统C4.5算法的运算效率和属性选择准确性进行研究,对其进行改进。运用泰勒级数和等价无穷小的原理对算法的计算公式进行简化,提高运算效率;在简化后的信息增益率计算公式中引入其它非类属性对于该属性的GINI指数的均值,用于调整因非类属性间冗余度问题导致的误差,提高算法属性选择的准确性,将改进后的算法称为G_C4.5。对G_C4.5、传统C4.5算法与其它改进算法进行对比实验分析,分析结果表明,G_C4.5算法在分类效率和准确性上都有一定提高。 展开更多
关键词 c4.5算法 泰勒级数 等价无穷小 GINI指数的均值 非类属性间关联性 G_c4.5算法
在线阅读 下载PDF
一种改进的C4.5算法 被引量:7
4
作者 李瑞 程亚楠 《科学技术与工程》 2010年第27期6670-6674,共5页
为了提高C4.5算法的有效性,提出了一种改进的MB—C4.5算法。该算法主要改进了C4.5算法的分枝策略和属性选取的标准。把分类效果较差的分枝合并到分类效果较好的分枝中。引进一个平衡度系数,系数大小由决策者依靠先验知识或领域知识确定... 为了提高C4.5算法的有效性,提出了一种改进的MB—C4.5算法。该算法主要改进了C4.5算法的分枝策略和属性选取的标准。把分类效果较差的分枝合并到分类效果较好的分枝中。引进一个平衡度系数,系数大小由决策者依靠先验知识或领域知识确定。MB—C4.5算法在提高重要属性的选择、减少无意义分枝、过度拟合等方面有一定提高。用该算法构造出的决策树进行分类更为准确、合理。对改进前后的算法用实例进行分析,说明MB—C4.5算法的有效性。 展开更多
关键词 c4.5算法 MB—c4.5算法 合并分枝 平衡度系数
在线阅读 下载PDF
决策树C4.5算法改进与应用 被引量:11
5
作者 陈杰 邬春学 《软件导刊》 2018年第10期88-92,共5页
针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TMC4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息... 针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TMC4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息增益和通过贝叶斯分类器得到的概率,使用条件判断确定最佳分割阈值;其次,使用简化的CCP(Cost-Complexity Pruning)方法和评价标准,对已生成决策树的子树根节点计算其表面误差率增益值和S值,从而判断是否删除决策树节点和分支。实验结果表明,用该算法生成的决策树进行分类更为精确、合理,表明TM-C4.5算法有效。 展开更多
关键词 c4.5 TM -c4.5算法 CCP 贝叶斯分类器 剪枝策略 评价标准
在线阅读 下载PDF
C4.5算法在2型糖尿病分类规则建立中的应用 被引量:15
6
作者 罗森林 成华 +3 位作者 顾毓清 张铁梅 曾平 陈峰 《计算机应用研究》 CSCD 北大核心 2004年第7期174-176,179,共4页
基于大量实测数据 ,将数据挖掘C4.5算法引入 2型糖尿病的数据处理之中 ,建立了多条有效规则 ,通过测试其患病与未患病的平均正确识别率达 97%。重要的是建立的这些规则同医学上的认识基本一致 ,可以说这些规则的建立为解释糖尿病发病因... 基于大量实测数据 ,将数据挖掘C4.5算法引入 2型糖尿病的数据处理之中 ,建立了多条有效规则 ,通过测试其患病与未患病的平均正确识别率达 97%。重要的是建立的这些规则同医学上的认识基本一致 ,可以说这些规则的建立为解释糖尿病发病因素之间的相互关系以及影响程度提供了一种新的方法 ,为建立 展开更多
关键词 2型糖尿病 c4.5算法 数据挖掘
在线阅读 下载PDF
基于C4.5算法的道路网网格模式识别 被引量:19
7
作者 田晶 艾廷华 丁绍军 《测绘学报》 EI CSCD 北大核心 2012年第1期121-126,共6页
提出一种基于C4.5算法的网格模式识别方法。该方法以道路网中的网眼为基本单元,根据上下文关系将其标识为属于网格模式和不属于网格模式两类。首先采用形状参量和关系参量描述网眼,然后,基于决策树C4.5算法分别对5参量描述和3参量描述... 提出一种基于C4.5算法的网格模式识别方法。该方法以道路网中的网眼为基本单元,根据上下文关系将其标识为属于网格模式和不属于网格模式两类。首先采用形状参量和关系参量描述网眼,然后,基于决策树C4.5算法分别对5参量描述和3参量描述数据构造分类器,运用10折交叉验证获得具有说服力的结果,其Kappa值分别为0.63和0.66,正确率分别为81.7%和82.9%,置信度90%的置信区间分别为[0.785,0.846]和[0.797,0.857]。在新数据上进行了识别效果的验证,结果表明该分类器可用于网格模式的识别。 展开更多
关键词 道路网 网格模式 模式识别 c4.5算法
在线阅读 下载PDF
基于改进的C4.5算法的网络流量分类方法 被引量:19
8
作者 周剑峰 阳爱民 刘吉财 《计算机工程与应用》 CSCD 2012年第5期71-74,共4页
在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提... 在基于C4.5算法的网络流量分类方法中,网络流量数据量的海量性及其特征的多样性使得决策树的构建速度、分类速度成为评价网络流量分类器的重要标准。在原C4.5算法的基础上提出一种改进的信息熵的计算方法,通过减少计算函数的复杂度,提高决策树的构建速度。实验表明,基于改进后算法的分类器在达到原有分类准确率的同时,极大地缩短了决策树的构成时间。 展开更多
关键词 网络流量分类 c4.5算法 信息熵 信息增益率 决策树
在线阅读 下载PDF
C4.5算法在在线学习行为评估系统中的应用 被引量:15
9
作者 范洁 杨岳湘 温璞 《计算机工程与设计》 CSCD 北大核心 2006年第6期946-948,共3页
基于数据挖掘技术构建了在线学习行为评估系统。利用C4.5算法挖掘学生在线学习行为与学习效果的历史数据,建立“学习行为—效果”模型。用此模型评估未来学生的在线学习状况,给出形成性评估的成绩。通过测试,评估结果较准确,教师和学生... 基于数据挖掘技术构建了在线学习行为评估系统。利用C4.5算法挖掘学生在线学习行为与学习效果的历史数据,建立“学习行为—效果”模型。用此模型评估未来学生的在线学习状况,给出形成性评估的成绩。通过测试,评估结果较准确,教师和学生的认可度达90%以上。系统的应用为在远程教学环境下客观、公正、合理的评估学生在线学习提供了有效方法和手段。 展开更多
关键词 决策树 c4.5 在线学习 评估
在线阅读 下载PDF
C4.5算法在保险客户流失分析中的应用 被引量:34
10
作者 桂现才 彭宏 王小华 《计算机工程与应用》 CSCD 北大核心 2005年第17期197-199,214,共4页
保持客户和吸引客户是保险公司提高竞争力的关键,目前保险公司对客户流失的分析是粗略的或根据经验来判断。论文利用面向属性归纳和决策树C4.5算法对保险客户基本信息进行分析,找出客户流失的特征,帮助保险公司有针对性地改善客户关系。
关键词 客户流失分析 保险 c4.5算法 决策树 面向属性归纳
在线阅读 下载PDF
一种基于变精度粗糙集的C4.5决策树改进算法 被引量:12
11
作者 刘兴文 王典洪 陈分雄 《计算机应用研究》 CSCD 北大核心 2011年第10期3649-3651,共3页
针对C4.5决策树构造复杂、分类精度不高等问题,提出了一种基于变精度粗糙集的决策树构造改进算法。该算法采用近似分类质量作为节点选择属性的启发函数,与信息增益率相比,该标准更能准确地刻画属性分类的综合贡献能力,同时对噪声有一定... 针对C4.5决策树构造复杂、分类精度不高等问题,提出了一种基于变精度粗糙集的决策树构造改进算法。该算法采用近似分类质量作为节点选择属性的启发函数,与信息增益率相比,该标准更能准确地刻画属性分类的综合贡献能力,同时对噪声有一定的抑制能力。此外还针对两个或两个以上属性的近似分类质量相等的特殊情形,给出了如何选择最优的分类属性作为节点的方法。实验结果证明,该算法构造的决策树在分类精度和规模上均优于C4.5算法。 展开更多
关键词 数据挖掘 决策树 信息增益率 c4.5算法 粗糙集 变精度粗糙集 近似分类质量
在线阅读 下载PDF
决策树C4.5连续属性分割阈值算法改进及其应用 被引量:41
12
作者 姚亚夫 邢留涛 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第12期3772-3776,共5页
结合Fayyad边界点原理提出一种新的连续值属性最佳分割阈值的选择算法。根据Fayyad连续值属性的最佳分割点总在边界点处的原理,只在连续属性分界点处的少数几个分割点中选择最佳分割阈值。构造并训练了改进C4.5分类器,将其应用于视频序... 结合Fayyad边界点原理提出一种新的连续值属性最佳分割阈值的选择算法。根据Fayyad连续值属性的最佳分割点总在边界点处的原理,只在连续属性分界点处的少数几个分割点中选择最佳分割阈值。构造并训练了改进C4.5分类器,将其应用于视频序列中的人车目标识别。实验结果表明:改进C4.5算法的计算量减少近20%,大大提高了决策树的生成效率,分类准确率也略有提高。 展开更多
关键词 决策树c4.5算法 连续属性 分割阈值 信息增益率
在线阅读 下载PDF
基于C4.5决策树算法的中医胃炎实验数据分类挖掘研究 被引量:10
13
作者 刘广 孙艳秋 裴媛 《中华中医药学刊》 CAS 北大核心 2016年第12期2958-2961,共4页
C4.5算法是决策树数据挖掘中功能相对比较全面的一种工具。实验对经过预处理后的800例中医胃炎的辨证数据病例采用C4.5算法进行分类,建立中医胃炎辨证分类决策树,并提取决策树中蕴含的分类规则。挖掘出的分类规则基本符合中医胃炎的辨... C4.5算法是决策树数据挖掘中功能相对比较全面的一种工具。实验对经过预处理后的800例中医胃炎的辨证数据病例采用C4.5算法进行分类,建立中医胃炎辨证分类决策树,并提取决策树中蕴含的分类规则。挖掘出的分类规则基本符合中医胃炎的辨证规律以及名老中医诊治胃炎的诊疗经验。 展开更多
关键词 中医胃炎 决策树 c4.5算法 信息增益 分类规则
原文传递
C4.5决策树展示算法的设计 被引量:21
14
作者 姜欣 徐六通 张雷 《计算机工程与应用》 CSCD 北大核心 2003年第4期93-94,97,共3页
分析了现有的展示C4.5算法结果决策树的方法的不足,设计了一种利用多叉树结构的直接输出来实现决策树展示的算法。在客户关系管理(CRM)应用于电信运营的研究项目中,该算法在数据挖掘平台上得到应用,实践证明,提高了决策树分类的效率和... 分析了现有的展示C4.5算法结果决策树的方法的不足,设计了一种利用多叉树结构的直接输出来实现决策树展示的算法。在客户关系管理(CRM)应用于电信运营的研究项目中,该算法在数据挖掘平台上得到应用,实践证明,提高了决策树分类的效率和展示的直观性。 展开更多
关键词 机器学习 c4.5算法 决策树展示算法 设计 多叉树结构
在线阅读 下载PDF
决策树C4.5算法在天然气输差分析中的应用 被引量:8
15
作者 张德政 李天驰 阿孜古丽 《计算机工程与应用》 CSCD 北大核心 2006年第23期208-210,共3页
分类器是数据挖掘的一种基本方法。文章首先介绍了分类器的基本概念和决策树构建思路,然后讲述了在天然气信息数据库的基础上如何建立决策树分类器(用Java语言)和寻找影响输差较大的因素,从而得出一些实用的预测输差的规则。
关键词 天然气数据 输差分析 数据挖掘 分类器 决策树c4.5
在线阅读 下载PDF
基于C4.5决策树的嵌入型恶意代码检测方法 被引量:10
16
作者 张福勇 齐德昱 胡镜林 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第5期68-72,共5页
嵌入型恶意代码以其高隐蔽性和难检测性,成为计算机安全的新威胁.文中针对以往的统计分析法没有充分考虑嵌入型恶意代码所占字节数小、信息增益大的特点提出一种采用C4.5决策树的嵌入型恶意代码检测方法,即通过提取训练样本中信息增益... 嵌入型恶意代码以其高隐蔽性和难检测性,成为计算机安全的新威胁.文中针对以往的统计分析法没有充分考虑嵌入型恶意代码所占字节数小、信息增益大的特点提出一种采用C4.5决策树的嵌入型恶意代码检测方法,即通过提取训练样本中信息增益最大的500个3-gram作为属性特征,建立决策树,实现对未知嵌入型恶意代码的检测.实验结果表明,文中方法在检测率和分类准确率上均具有明显优势,对感染了嵌入型恶意代码的Word文档的检测率达99.80%. 展开更多
关键词 嵌入型恶意代码 恶意代码检测 c4.5决策树 BOOSTING算法
在线阅读 下载PDF
基于C4.5决策树算法的道路结冰预报模型构建与应用 被引量:14
17
作者 陈凯 徐国庆 +4 位作者 熊焘 侯纪勇 王曦晨 戚国辉 刘青 《交通运输研究》 2018年第1期57-62,共6页
为准确预报冬季道路结冰情况,保障交通运输安全,需要构建精度高、实用性强的道路结冰预报模型。将道路是否结冰抽象为二元分类问题,采用C4.5决策树算法,以通辽地区历史日最低气温、日降水量、日积雪深度和道路结冰数据为训练数据,构建... 为准确预报冬季道路结冰情况,保障交通运输安全,需要构建精度高、实用性强的道路结冰预报模型。将道路是否结冰抽象为二元分类问题,采用C4.5决策树算法,以通辽地区历史日最低气温、日降水量、日积雪深度和道路结冰数据为训练数据,构建了道路结冰预报模型,并以赤峰地区和沈阳到锡林浩特特高压设备运输期间道路结冰预报为例对模型的准确率加以验证。计算结果表明,赤峰地区道路结冰模型准确率为93.3%,沈阳到锡林浩特特高压交流输变电主设备运输期间道路结冰预测结果与实际情况符合度高达86.4%。这表明基于C4.5决策树算法的道路积冰预警模型准确度较高且实用性强,可作为我国东北部地区冬季道路结冰预报方法加以推广,也可为其他地区道路结冰预报提供参考。 展开更多
关键词 道路结冰 c4.5决策树 模型训练 预报模型 特高压主设备运输
在线阅读 下载PDF
融合GINI指数的C4.5算法的分类研究 被引量:6
18
作者 聂斌 李欢 +3 位作者 罗计根 杜建强 周丽 黄强 《江西师范大学学报(自然科学版)》 CAS 北大核心 2019年第5期469-472,共4页
信息增益率倾向于取值数较少的属性和产生不平衡的划分,GINI指数偏向于取值数较多的属性且区间趋于平衡的划分.基于此,该文提出融合GINI指数的C4.5改进算法,首先计算候选属性的信息增益率和GINI指数,其次计算信息增益率和GINI指数的比值... 信息增益率倾向于取值数较少的属性和产生不平衡的划分,GINI指数偏向于取值数较多的属性且区间趋于平衡的划分.基于此,该文提出融合GINI指数的C4.5改进算法,首先计算候选属性的信息增益率和GINI指数,其次计算信息增益率和GINI指数的比值,最后筛选出比值最大的属性作为划分结点,改进了C4.5算法的不足.以10次10折交叉验证准确率和运行时间为评价指标,通过5组UCI数据测试改进算法性能,并与ID3、C4.5和CART算法对比实验.实验结果表明:融合GINI指数的C4.5算法减轻了属性取值多少对划分结点选择的影响,并且缓和了划分区间的不平衡,提高了分类准确率和运行效率,算法更加稳定,可行有效. 展开更多
关键词 c4.5算法 GINI指数 决策树 中医药信息
在线阅读 下载PDF
基于C4.5算法的敏感图像检测方法 被引量:4
19
作者 罗森林 辛子英 冯磊 《北京理工大学学报》 EI CAS CSCD 北大核心 2006年第5期451-453,共3页
提出一种基于2次C4.5分类的敏感图像检测方法.该方法利用Daubechies小波和灰度共生矩阵提取图片的纹理信息,在HSI空间和YCbCr空间提取颜色特征,进行第1次基于C4.5算法的训练和分类;对分类生成的0,1二值空间进行特征提取,将所有特征分量... 提出一种基于2次C4.5分类的敏感图像检测方法.该方法利用Daubechies小波和灰度共生矩阵提取图片的纹理信息,在HSI空间和YCbCr空间提取颜色特征,进行第1次基于C4.5算法的训练和分类;对分类生成的0,1二值空间进行特征提取,将所有特征分量融合进行基于C4.5算法和2次训练和分类.基于2次训练生成的规则进行敏感图片的检测.实验结果表明,该方法对于敏感图片分类正确率达93.3%以上,与基于颜色和纹理特征的直接检测方法相比,进一步提高了正确识别率. 展开更多
关键词 敏感图像 皮肤检测 颜色空间 c4.5算法
在线阅读 下载PDF
具有容噪特性的C4.5算法改进 被引量:10
20
作者 王伟 李磊 张志鸿 《计算机科学》 CSCD 北大核心 2015年第12期268-271,287,共5页
针对有噪声的高维数据引起决策树预测准确率下降的问题,利用容噪主成分分析(Noise-free Principal Component Anlysis,NFPCA)算法思想对C4.5算法改进而形成NFPCA-in-C4.5算法。该算法一方面将高维数据噪声控制问题转化为拟合数据特征与... 针对有噪声的高维数据引起决策树预测准确率下降的问题,利用容噪主成分分析(Noise-free Principal Component Anlysis,NFPCA)算法思想对C4.5算法改进而形成NFPCA-in-C4.5算法。该算法一方面将高维数据噪声控制问题转化为拟合数据特征与控制平滑度相结合的最优化问题,从而获得主成分空间;另一方面在决策树自顶向下构建新节点的过程中,再将主成分空间恢复到原始数据空间来避免降维过程中属性特征信息永久消失。实验结果表明NFPCA-in-C4.5算法兼具降维和容噪功能,避免了降维中由特征信息损失和噪声残留造成的预测模型准确率大幅降低的问题。 展开更多
关键词 高维数据噪声 容噪 主成分分析 c4.5算法
在线阅读 下载PDF
上一页 1 2 32 下一页 到第
使用帮助 返回顶部