期刊文献+
共找到269篇文章
< 1 2 14 >
每页显示 20 50 100
FPGA-Based Network Traffic Security: Design and Implementation Using C5.0 Decision Tree Classifier 被引量:2
1
作者 Tarek Salah Sobh Mohamed Ibrahiem Amer 《Journal of Electronic Science and Technology》 CAS 2013年第4期393-403,共11页
In this work, a hardware intrusion detection system (IDS) model and its implementation are introduced to perform online real-time traffic monitoring and analysis. The introduced system gathers some advantages of man... In this work, a hardware intrusion detection system (IDS) model and its implementation are introduced to perform online real-time traffic monitoring and analysis. The introduced system gathers some advantages of many IDSs: hardware based from implementation point of view, network based from system type point of view, and anomaly detection from detection approach point of view. In addition, it can detect most of network attacks, such as denial of services (DOS), leakage, etc. from detection behavior point of view and can detect both internal and external intruders from intruder type point of view. Gathering these features in one IDS system gives lots of strengths and advantages of the work. The system is implemented by using field programmable gate array (FPGA), giving a more advantages to the system. A C5.0 decision tree classifier is used as inference engine to the system and gives a high detection ratio of 99.93%. 展开更多
关键词 c5.0 decision tree field programm-able gate array network monitoring network security.
在线阅读 下载PDF
基于C5.0决策树算法的测绘遥感图像信息自动分类方法 被引量:2
2
作者 谢平 《自动化应用》 2025年第2期96-98,101,共4页
常规的测绘遥感图像信息自动分类方法主要使用随机森林-支持向量机(RF-SVM)融合模型提取图像信息特征,易受预期任务动态改变影响,导致分类评估指标不佳,因此,提出了一种基于C5.0决策树算法的测绘遥感图像信息自动分类方法。降维提取测... 常规的测绘遥感图像信息自动分类方法主要使用随机森林-支持向量机(RF-SVM)融合模型提取图像信息特征,易受预期任务动态改变影响,导致分类评估指标不佳,因此,提出了一种基于C5.0决策树算法的测绘遥感图像信息自动分类方法。降维提取测绘遥感图像信息特征,利用决策树算法进行图像信息自动分类属性度量,实现测绘遥感图像信息的自动分类。结果表明,该设计方法的Producer's Accuracy、User's Accuracy、Overall Accuracy、Kappa均较高,分类效果较好,具有一定的应用价值。 展开更多
关键词 c5.0决策树算法 测绘遥感 图像信息 自动分类 随机森林-支持向量机
在线阅读 下载PDF
基于C5.0决策树算法的西北干旱区土地覆盖分类研究——以甘肃省武威市为例 被引量:32
3
作者 齐红超 祁元 徐瑱 《遥感技术与应用》 CSCD 北大核心 2009年第5期648-653,I0005,共7页
西北干旱区面积广阔,由于土地利用类型多样,成因复杂,对环境变化敏感、变化过程快、幅度大、景观差异明显等特点,在影像上表现出的"同物异谱"现象明显;利用常规目视解译、监督非监督分类、人工参与的决策树分类等方法在效率... 西北干旱区面积广阔,由于土地利用类型多样,成因复杂,对环境变化敏感、变化过程快、幅度大、景观差异明显等特点,在影像上表现出的"同物异谱"现象明显;利用常规目视解译、监督非监督分类、人工参与的决策树分类等方法在效率或精度等方面各有其缺陷。采用机器学习C5.0决策树算法,综合利用地物波谱、NDVI、TC、纹理等信息,根据样本数据自动挖掘分类规则并对整个研究区进行地物分类。机器学习的决策树可以挖掘出更多的分类规则,C5.0算法对采样数据的分布没有要求,可以处理离散和连续数据,生成的规则易于理解,分类精度高,可以满足西北干旱区大面积的土地利用/覆被变化制图的需要。 展开更多
关键词 c5.0算法 西北干旱区 土地覆被 See5.0 NLCD
原文传递
交通事故严重程度C5.0决策树预测模型 被引量:21
4
作者 孙轶轩 邵春福 +1 位作者 赵丹 欧阳松寿 《长安大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第5期109-116,共8页
根据中国现行交通事故严重程度分类与事故信息数据分布特征,基于C5.0决策树方法,选取某省会城市城区及周边重点公路16 009起交通事故现场数据,分别将事故严重程度输出变量按照2分类和3分类,输入变量按照空间属性、涉事驾驶人及车辆属性... 根据中国现行交通事故严重程度分类与事故信息数据分布特征,基于C5.0决策树方法,选取某省会城市城区及周边重点公路16 009起交通事故现场数据,分别将事故严重程度输出变量按照2分类和3分类,输入变量按照空间属性、涉事驾驶人及车辆属性和全属性,建立事故严重程度预测模型,生成相应规则集并利用测试样本进行检验和模型对比。研究结果表明:2分类和3分类事故严重程度预测模型精度分别为70%和61%,多模型综合优度有所提升;实证规则集揭示了影响事故严重程度分类的因素主要有,碰撞类型、道路属性、事故致因和驾驶人类型等。 展开更多
关键词 交通工程 交通事故严重程度 预测模型 数据挖掘 决策树 c5.0算法
原文传递
基于C5.0的遥感影像决策树分类实验研究 被引量:15
5
作者 白秀莲 巴雅尔 哈斯其其格 《遥感技术与应用》 CSCD 北大核心 2014年第2期338-343,共6页
决策树算法是一种非参数化、非线性的监督分类法。以2010年8月1日Landsat TM影像为基础遥感信息源,以内蒙古自治区赤峰市中部巴林右旗、林西县、克什克腾旗、翁牛特旗交汇处的区域为研究区,通过多次修改完善训练样本数据集,然后把6个原... 决策树算法是一种非参数化、非线性的监督分类法。以2010年8月1日Landsat TM影像为基础遥感信息源,以内蒙古自治区赤峰市中部巴林右旗、林西县、克什克腾旗、翁牛特旗交汇处的区域为研究区,通过多次修改完善训练样本数据集,然后把6个原始波段和NDVI、主成分分析后的前3个主分量、常用8个纹理特征以及3个地形特征等共21个特征变量组合成5个不同特征变量组合,采用典型决策树算法C5.0进行了遥感影像分类实验,与最大似然分类结果进行对比。结果表明:C5.0决策树的分类结果优于最大似然结果,尤其是特征变量组合恰当的时候,能够有效利用相关辅助信息,因而最终的分类结果更能满足用户需求。 展开更多
关键词 遥感影像 决策树 分类 c5.0
原文传递
基于C5.0决策树分类算法的ETM+影像信息提取 被引量:32
6
作者 温兴平 胡光道 杨晓峰 《地理与地理信息科学》 CSCD 北大核心 2007年第6期26-29,共4页
利用C5.0决策树算法对ETM+影像进行信息提取,通过与其他分类方法提取结果的对比,得出C5.0决策树分类算法精度较高。大气校正与数据融合可明显提高分类精度,利用经过NDVI、NDBI、缨帽变换处理后的影像组合数据进行信息提取可进一步提高... 利用C5.0决策树算法对ETM+影像进行信息提取,通过与其他分类方法提取结果的对比,得出C5.0决策树分类算法精度较高。大气校正与数据融合可明显提高分类精度,利用经过NDVI、NDBI、缨帽变换处理后的影像组合数据进行信息提取可进一步提高分类精度。研究发现,C5.0决策树算法用未处理的资料生成决策树的效果较差,而经大气校正和数据融合后计算出NDVI、NDBI及缨帽变换的前3个分量的组合数据生成的决策树深度最小,并且分类精度最高。 展开更多
关键词 c5.0决策树算法 ETM+遥感影像 信息提取
在线阅读 下载PDF
基于C5.0算法的森林资源变化检测方法研究——以山东省徂徕山林区为例 被引量:11
7
作者 王志慧 李世明 张艺伟 《西北林学院学报》 CSCD 北大核心 2011年第5期185-191,共7页
以山东省徂徕山林场为试验区,利用两时相的TM与ETM+遥感数据对该地区的针叶林、阔叶林等森林资源的变化进行研究。将基于C5.0算法的决策树分类方法应用于森林变化检测,并对3种检测方案进行试验比较:(1)以单一时相图像作为数据源并各自分... 以山东省徂徕山林场为试验区,利用两时相的TM与ETM+遥感数据对该地区的针叶林、阔叶林等森林资源的变化进行研究。将基于C5.0算法的决策树分类方法应用于森林变化检测,并对3种检测方案进行试验比较:(1)以单一时相图像作为数据源并各自分类,分类后作比较提取变化信息;(2)以两时相图像的原始波段数据作为数据源训练规则,并生成变化检测图;(3)以两时相图像加上邻近相关分析图像作为数据源训练规则,生成变化检测图。试验结果表明,基于C5.0算法的决策树分类可以有效的进行森林变化检测,并且加入邻近相关分析图像后的变化检测精度达到最高。 展开更多
关键词 变化检测 c5.0 决策树 邻近相关分析
在线阅读 下载PDF
C5.0算法的改进及应用 被引量:12
8
作者 罗丽娟 段隆振 +1 位作者 段文影 刘萍 《南昌大学学报(工科版)》 CAS 2017年第1期92-97,共6页
C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建... C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建立的多个模型的权重进行调整,提出了一种新的C5.0改进算法,并将其应用于信贷逾期预测上。使用借款人的历史还款数据进行实验,并与其他算法进行比较,结果表明:C5.0改进算法相比其他算法具有更高的准确率和效率。 展开更多
关键词 c5.0算法 信息增益率 置信区间 权重调整 信贷逾期
在线阅读 下载PDF
基于C5.0决策树算法的元胞自动机土地利用变化模拟模型 被引量:30
9
作者 柯新利 边馥苓 《长江流域资源与环境》 CAS CSSCI CSCD 北大核心 2010年第4期403-408,共6页
C5.0决策树算法可以揭示数据中的结构化信息,建立直观、易于理解的树形结构,可以用于元胞自动机转换规则的获取。提出了基于C5.0决策树算法的元胞自动机模型,分析了模型构建的理论和原理以及实现方法。在此基础上,以杭州市城市用地演变... C5.0决策树算法可以揭示数据中的结构化信息,建立直观、易于理解的树形结构,可以用于元胞自动机转换规则的获取。提出了基于C5.0决策树算法的元胞自动机模型,分析了模型构建的理论和原理以及实现方法。在此基础上,以杭州市城市用地演变为例,利用C5.0决策树算法从已有的城市用地及其影响因子数据中挖掘出城市用地的演变规则,并将获得的转换规则应用到元胞自动机模型中进行城市用地演变的动态模拟与预测。结果表明:(1)利用C5.0决策树算法获取转换规则可以在较低采样率的前提下保证具有较高的精度;(2)与其它获取元胞自动机转换规则的方法相比,C5.0决策树算法生成的规则清晰明确,很适合用来获取元胞转换规则;(3)基于C5.0决策树算法的元胞自动机模型在模拟城市用地演变方面具有较高的模拟精度,模拟结果可靠。 展开更多
关键词 c5.0决策树 元胞自动机 土地利用变化
原文传递
基于C5.0算法的胃癌生存预测模型研究 被引量:6
10
作者 黄志刚 刘虹 +1 位作者 刘娟 张岐山 《南京信息工程大学学报(自然科学版)》 CAS 2017年第4期406-410,共5页
我国的胃癌发病率高,每年新增胃癌患者占全世界每年新增数量的42%,胃癌成为我国恶性肿瘤防控的重点.本文针对胃癌数据的特征,给出数据预处理和集成方法;采用C5.0分类算法,构建了胃癌生存预测模型,并首次采用美国癌症研究所的SEER数据库... 我国的胃癌发病率高,每年新增胃癌患者占全世界每年新增数量的42%,胃癌成为我国恶性肿瘤防控的重点.本文针对胃癌数据的特征,给出数据预处理和集成方法;采用C5.0分类算法,构建了胃癌生存预测模型,并首次采用美国癌症研究所的SEER数据库进行预测实验.实验结果表明:C5.0预测的精确度、特异性均高于BP-神经网络算法;胃癌患者的出生地点与最终的存活状态之间存在较强的相关性.该研究是数据挖掘技术在医学领域的一个实际应用,对胃癌的临床诊断具有一定的参考价值,可为医生制定合理的治疗和预防方案提供一定参考. 展开更多
关键词 数据挖掘 c5.0分类算法 胃癌 生存预测 SEER数据库
在线阅读 下载PDF
基于ROSE和C5.0算法的打鼾者OSAHS初筛模型 被引量:3
11
作者 杜国栋 吕云辉 +4 位作者 马磊 相艳 邵党国 雷强 胡蓉 《计算机工程与应用》 CSCD 北大核心 2018年第3期250-254,共5页
使用医疗信息系统的数据进行睡眠呼吸暂停低通气综合征(OSAHS)预测和分析过程中,存在不平衡数据问题。为此,在现有临床研究的基础上,提出了一种基于ROSE(Random Over Sampling Examples)和C5.0算法的初筛模型。利用收集到的人体测量学... 使用医疗信息系统的数据进行睡眠呼吸暂停低通气综合征(OSAHS)预测和分析过程中,存在不平衡数据问题。为此,在现有临床研究的基础上,提出了一种基于ROSE(Random Over Sampling Examples)和C5.0算法的初筛模型。利用收集到的人体测量学指标数据,通过数据预处理,删除异常值并填补缺失值。然后采用ROSE算法对数据进行平衡,利用C5.0分类器对平衡后的数据构建筛查模型,通过十则交叉验证的方法检验模型的筛查效果。实验结果表明,使用该模型进行打鼾患者的OSAHS筛查,可以有效地提高筛查效率。 展开更多
关键词 不均衡数据 初筛模型 随机过采样(ROSE) c5.0决策树
在线阅读 下载PDF
基于C5.0算法的小额网贷平台的风险监控研究 被引量:5
12
作者 王茂光 葛蕾蕾 赵江平 《中国管理科学》 CSSCI 北大核心 2016年第S1期345-352,共8页
近年来,互联网金融在国内发展迅速,各种类型的小额网贷平台更是层出不穷,但是随着平台跑路,欺诈等各种问题的涌现,暴露出对小额网贷平台监管的不足。本文以C5.0决策树算法为核心建立起风险监控模型,首先利用大数据技术抓取平台数据、公... 近年来,互联网金融在国内发展迅速,各种类型的小额网贷平台更是层出不穷,但是随着平台跑路,欺诈等各种问题的涌现,暴露出对小额网贷平台监管的不足。本文以C5.0决策树算法为核心建立起风险监控模型,首先利用大数据技术抓取平台数据、公开信息数据和征信机构数据,然后对数据分析,筛选关键指标体系,建立了一种风控模型,最后评估和验证模型及算法的有效性,并通过对模型的参数进行调整,提出以保证整体错误率的前提下,尽可能的降低α错误率的评价标准。通过实验发现,该风控模型对问题平台有着很好的预测能力。 展开更多
关键词 小额网贷 风险监控 c5.0决策树算法 α错误率
原文传递
基于C5.0决策树和时序HJ-1A/B CCD数据的神农架林区植被分类 被引量:13
13
作者 李梦莹 胡勇 王征禹 《长江流域资源与环境》 CAS CSSCI CSCD 北大核心 2016年第7期1070-1077,共8页
我国神农架林区海拔高、气候复杂,森林类型多样,结构破碎,森林遥感分类难度较大。将2013年时间序列HJ-1A/B CCD遥感影像作为数据源,计算出植被指数(NDVI、DVI、RVI)和主成分第一分量(PC1),使用DEM数据生成地形因子(高程、坡度、坡... 我国神农架林区海拔高、气候复杂,森林类型多样,结构破碎,森林遥感分类难度较大。将2013年时间序列HJ-1A/B CCD遥感影像作为数据源,计算出植被指数(NDVI、DVI、RVI)和主成分第一分量(PC1),使用DEM数据生成地形因子(高程、坡度、坡向),构建植被分类时序因子集。运用C5.0决策树分类法将神农架林区植被细分为七类:针叶林;针阔混交林;落叶阔叶林;常绿和落叶阔叶混交林;常绿阔叶林;灌丛和草甸。结果表明:该方法的总体精度为72.7%,Kappa系数为0.67;在6~8月,针叶林、草甸和灌丛的植被指数明显低于常绿阔叶林、常绿和落叶阔叶混交林、落叶阔叶林和针阔混交林,对分类的贡献较大,称为植被分类的"窗口期"。PC1、NDVI和高程因子对神农架林地的区分度较高,而坡度、坡向和RVI因子对分类帮助不大。作为一种智能分类方法,C5.0决策树分类方法应用于30m分辨率的时间序列HJ-1A/B CCD数据,能够将地貌复杂的神农架林区植被分为七类,提高了类别精度,具有更高的应用价值。 展开更多
关键词 c5.0决策树 HJ-1A/B CCD数据 神农架林区 时间序列 森林次级分类
原文传递
改进Relief-C5.0的恶意域名检测算法 被引量:7
14
作者 马栋林 张澍寰 赵宏 《计算机工程与应用》 CSCD 北大核心 2022年第11期100-106,共7页
针对目前恶意域名检测算法中分类模型计算复杂度较大、实时性不强以及准确率不高等问题,提出了Rf-C5(Relief-C5.0)恶意域名检测算法模型。提取待测域名的全局URL特征,根据提取的特征按照改进的Relief算法进行权重计算,并依据权重值进行... 针对目前恶意域名检测算法中分类模型计算复杂度较大、实时性不强以及准确率不高等问题,提出了Rf-C5(Relief-C5.0)恶意域名检测算法模型。提取待测域名的全局URL特征,根据提取的特征按照改进的Relief算法进行权重计算,并依据权重值进行优先级排序;选取权重值排名前20的关键特征作为C5.0分类器的输入端,进行合法域名与恶意域名的分类。实验结果表明,在大样本数据集下,Rf-C5模型与当前主流恶意域名检测算法相比,在提高平均检测速率的基础上,检测准确率提高了1.58~4.91个百分点。 展开更多
关键词 恶意域名 URL特征 改进的Relief算法 c5.0分类器
在线阅读 下载PDF
基于多分类器的C5.0决策树植被分类方法 被引量:6
15
作者 刘丹 杨风暴 +2 位作者 卫红 李大威 韩晓峰 《图学学报》 CSCD 北大核心 2017年第5期722-728,共7页
针对光谱角制图(SAM)和最大似然(MLC)分类器对AVIRIS高光谱遥感图像进行植被分类精度均不高的问题,提出了一种基于多分类器的C5.0决策树植被分类方法。首先,利用支持向量机(SVM),进行核函数以及核函数参数选择,提取出AVIRIS高光谱图像... 针对光谱角制图(SAM)和最大似然(MLC)分类器对AVIRIS高光谱遥感图像进行植被分类精度均不高的问题,提出了一种基于多分类器的C5.0决策树植被分类方法。首先,利用支持向量机(SVM),进行核函数以及核函数参数选择,提取出AVIRIS高光谱图像中的植被信息。其次,利用C5.0算法将光谱角制图和最大似然分类器组合,作为决策树的特征属性,学习样本训练并生成分类规则;根据C5.0算法计算植被样本中对应分类器的信息增益率,选择信息增益率最大的属性去分类样本;当叶样本的分类结果满足停止生长的阈值,输出样本分类的结果,否则,回到开始,递归调用以上方法继续分类叶样本,直到所有子集仅包含一个植被类别的样本完成决策。实验结果表明,与光谱角制图和最大似然分类器相比,本文提出的方法整体精度分别提高了6.04%、2.92%,不仅证实了多分类器组合的可行性和有效性,而且更加适用于AVIRIS高光谱图像中的植被调查。 展开更多
关键词 高光谱图像 遥感 SVM SAM MLC c5.0
在线阅读 下载PDF
一种结合分水岭与决策树C5.0的极化SAR分类方法 被引量:6
16
作者 张剑清 段艳 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2014年第8期891-896,共6页
提出了一种利用多种极化特征并结合分水岭算法与决策树C5.0分类器的极化SAR数据分类方法。首先对极化SAR数据进行极化精致Lee滤波,接着对其进行极化分解得到多个极化通道与Pauli RGB图像,改进梯度图生成法并进行形态学分水岭分割与区域... 提出了一种利用多种极化特征并结合分水岭算法与决策树C5.0分类器的极化SAR数据分类方法。首先对极化SAR数据进行极化精致Lee滤波,接着对其进行极化分解得到多个极化通道与Pauli RGB图像,改进梯度图生成法并进行形态学分水岭分割与区域合并,最后选择样本构建决策树C5.0分类器并进行分类。实验结果表明,该方法与传统基于像素的分类方法相比精度有显著提高,同时由于使用了较多的极化特征,也使分类精度在一定程度上得到了提高。 展开更多
关键词 极化精致Lee滤波 Pauli分解 极化分解 分水岭分割 决策树c5.0
原文传递
基于C5.0与Apriori算法的森林生物量等级评价与因子关联分析 被引量:2
17
作者 王霓虹 高萌 +1 位作者 李丹 刘立臣 《中南林业科技大学学报》 CAS CSCD 北大核心 2015年第3期1-6,共6页
针对生物量影响因子量化研究较少、方法单一及区域生物量评价不足且基于单个树种生物量模型进行评价时工作量过大的问题,以孟家岗林场的三类小班清查数据为基础,选取与生物量水平相关的11个因子,利用C5.0算法进行生物量决策树建模,并进... 针对生物量影响因子量化研究较少、方法单一及区域生物量评价不足且基于单个树种生物量模型进行评价时工作量过大的问题,以孟家岗林场的三类小班清查数据为基础,选取与生物量水平相关的11个因子,利用C5.0算法进行生物量决策树建模,并进一步利用Apriror算法进行生物量强影响因子的关联规则挖掘。结果表明:生物量决策树模型的分类预测精度为88.78%,生物量影响因子的量化结果分别为树高(0.348)、胸径(0.225)、林分类型(0.196)、龄级(0.162)、郁闭度(0.134)、坡度(0.096)、海拔(0.074)、坡向(0.065)、立地类型(0.052)和坡位(0.037);得到707条置信度在80%以上、支持度在10%以上的因子关联规则,揭示了生物量影响因子间的隐含关联关系。建立的生物量决策树模型能为快速的区域生物量预测和评价提供模型参考,建立的关联规则评估模型能够为以碳汇为目标的森林生产与经营提供客观评价指标。 展开更多
关键词 森林生物量评价 生物量影响因子 c5.0算法 APRIORI算法 关联分析
在线阅读 下载PDF
数据挖掘:C5.0决策树算法在警察院校学生体质分析中的应用 被引量:5
18
作者 宋兆铭 叶菁 董如军 《四川体育科学》 2020年第1期52-55,74,共5页
C5.0决策树算法适用于大数据集处理,特别是它的Boosting集成机器学习算法可以有效地将精度较低的"弱学习算法"提升为精度较高的"强学习算法",从而达到模型修剪与优化的目的。研究结果表明:C5.0决策树算法生成的模... C5.0决策树算法适用于大数据集处理,特别是它的Boosting集成机器学习算法可以有效地将精度较低的"弱学习算法"提升为精度较高的"强学习算法",从而达到模型修剪与优化的目的。研究结果表明:C5.0决策树算法生成的模型可以精确地评价学生的体质健康状况(97.8%)且模型预测的泛化能力较强(98.1%)。因此,C5.0决策树算法可以用来判断影响警察院校学生体质测试成绩的关键因素,为深层挖掘相关警务数据内涵与监测提供了实证依据。 展开更多
关键词 c5.0决策树 警察院校 学生体质
在线阅读 下载PDF
三种分类算法偏差-方差结构的比较:MCLP,LDA和C5.0 被引量:1
19
作者 朱梅红 石勇 +1 位作者 李爱华 张东玲 《中国科学院研究生院学报》 CAS CSCD 北大核心 2009年第4期443-450,共8页
基于Domingos的期望预测误差分解框架,在3个数据集上,对MCLP、LDA和C5.0这3种算法的偏差-方差结构特点进行了比较分析.实验结果表明,一般来说,C5.0呈现低偏差-高方差的特点,LDA与之相反,而MCLP则介于两者之间,比较接近LDA.当训练集样本... 基于Domingos的期望预测误差分解框架,在3个数据集上,对MCLP、LDA和C5.0这3种算法的偏差-方差结构特点进行了比较分析.实验结果表明,一般来说,C5.0呈现低偏差-高方差的特点,LDA与之相反,而MCLP则介于两者之间,比较接近LDA.当训练集样本量较小时,MCLP的偏差和方差都相对较高,而随着训练集的增大,MCLP的偏差和方差明显减小,甚至低于其他两者. 展开更多
关键词 多目标线性规划 线性判别分析 c5.0 偏差 方差
在线阅读 下载PDF
基于EasyEnsemble和C5.0决策树算法的患者非医嘱离院预测研究 被引量:6
20
作者 李杰 张睿 +1 位作者 芮晨 王欣然 《中国卫生统计》 CSCD 北大核心 2018年第4期593-595,共3页
目的在C5.0决策树算法的基础上,结合处理不平衡样本集的Easy Ensemble思想,建立患者非医嘱离院预测模型,有效识别非医嘱离院倾向患者。方法基于Easy Ensemble思想,通过Bootstrap采样方法抽取多数类样本子集组建多个新的均衡数据样本集,... 目的在C5.0决策树算法的基础上,结合处理不平衡样本集的Easy Ensemble思想,建立患者非医嘱离院预测模型,有效识别非医嘱离院倾向患者。方法基于Easy Ensemble思想,通过Bootstrap采样方法抽取多数类样本子集组建多个新的均衡数据样本集,运用C5.0决策树算法并结合交叉验证方法与代价矩阵,训练多个基分类器,最后经Bagging算法集成,得到最终预测模型。结果在10组测试集下平均总分类准确率、平均平衡准确率、少数类别样本平均召回率和平均AUC值分别达到74.27%、82.34%、91.70%、86.21%。结论基于Easy Ensemble和C5.0决策树算法的患者非医嘱离院预测模型有较好较稳定的识别性能,为医院提升医疗质量和服务水平,降低非医嘱离院率提供了有力依据。 展开更多
关键词 非医嘱离院 EasyEnsemble c5.0 数据挖掘
暂未订购
上一页 1 2 14 下一页 到第
使用帮助 返回顶部