-
题名决策树C4.5算法改进与应用
被引量:10
- 1
-
-
作者
陈杰
邬春学
-
机构
上海理工大学光电信息与计算机工程学院
-
出处
《软件导刊》
2018年第10期88-92,共5页
-
基金
上海市科学计划项目(16111107502
17511107203)
-
文摘
针对决策树算法C4.5在处理数据挖掘分类问题中出现的算法低效以及过拟合问题,提出一种改进的TMC4.5算法。该算法主要改进了C4.5算法的分支和剪枝策略。首先,将升序排序后的属性按照边界定理,得出分割类别可能分布的切点,比较各点的信息增益和通过贝叶斯分类器得到的概率,使用条件判断确定最佳分割阈值;其次,使用简化的CCP(Cost-Complexity Pruning)方法和评价标准,对已生成决策树的子树根节点计算其表面误差率增益值和S值,从而判断是否删除决策树节点和分支。实验结果表明,用该算法生成的决策树进行分类更为精确、合理,表明TM-C4.5算法有效。
-
关键词
C4.5
tm
-c4.5算法
CCP
贝叶斯分类器
剪枝策略
评价标准
-
Keywords
C4.5
tm -c4.5 algorithm
CCP
Bayesian classifier
pruning strategy
evaluation standard
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-