期刊文献+
共找到2,222篇文章
< 1 2 112 >
每页显示 20 50 100
Landslide susceptibility zonation method based on C5.0 decision tree and K-means cluster algorithms to improve the efficiency of risk management 被引量:23
1
作者 Zizheng Guo Yu Shi +2 位作者 Faming Huang Xuanmei Fan Jinsong Huang 《Geoscience Frontiers》 SCIE CAS CSCD 2021年第6期243-261,共19页
Machine learning algorithms are an important measure with which to perform landslide susceptibility assessments, but most studies use GIS-based classification methods to conduct susceptibility zonation.This study pres... Machine learning algorithms are an important measure with which to perform landslide susceptibility assessments, but most studies use GIS-based classification methods to conduct susceptibility zonation.This study presents a machine learning approach based on the C5.0 decision tree(DT) model and the K-means cluster algorithm to produce a regional landslide susceptibility map. Yanchang County, a typical landslide-prone area located in northwestern China, was taken as the area of interest to introduce the proposed application procedure. A landslide inventory containing 82 landslides was prepared and subsequently randomly partitioned into two subsets: training data(70% landslide pixels) and validation data(30% landslide pixels). Fourteen landslide influencing factors were considered in the input dataset and were used to calculate the landslide occurrence probability based on the C5.0 decision tree model.Susceptibility zonation was implemented according to the cut-off values calculated by the K-means cluster algorithm. The validation results of the model performance analysis showed that the AUC(area under the receiver operating characteristic(ROC) curve) of the proposed model was the highest, reaching 0.88,compared with traditional models(support vector machine(SVM) = 0.85, Bayesian network(BN) = 0.81,frequency ratio(FR) = 0.75, weight of evidence(WOE) = 0.76). The landslide frequency ratio and frequency density of the high susceptibility zones were 6.76/km^(2) and 0.88/km^(2), respectively, which were much higher than those of the low susceptibility zones. The top 20% interval of landslide occurrence probability contained 89% of the historical landslides but only accounted for 10.3% of the total area.Our results indicate that the distribution of high susceptibility zones was more focused without containing more " stable" pixels. Therefore, the obtained susceptibility map is suitable for application to landslide risk management practices. 展开更多
关键词 Landslide susceptibility Frequency ratio c5.0 decision tree K-means cluster Classification Risk management
在线阅读 下载PDF
Study on Prediction Model of Number of Rainstorm Days in Summer Based on C5.0 Decision Tree Algorithm
2
作者 Shi Yimin Chen Weiwei Zhu Yunfeng 《Meteorological and Environmental Research》 CAS 2019年第2期56-60,共5页
Based on the data of daily precipitation in Lianyungang area from 1951 to 2012 and various climate signal data from the National Climate Center website and the NOAA website,a model for predicting whether the number of... Based on the data of daily precipitation in Lianyungang area from 1951 to 2012 and various climate signal data from the National Climate Center website and the NOAA website,a model for predicting whether the number of rainstorm days in summer in Lianyungang area is large was established by the classical C5. 0 decision tree algorithm. The data samples in 48 years( accounting for about 80% of total number of samples)was as the training set of a model,and the training accuracy rate of the model was 95. 83%. The data samples in the remaining 14 years( accounting for about 20% of total number of samples) were used as the test set of the model to test the model,and the test accuracy of the model was 85. 71%. The results showed that the prediction model of number of rainstorm days in summer constructed by C5. 0 algorithm had high accuracy and was easy to explain. Moreover,it is convenient for meteorological staff to use directly. At the same time,this study provides a new idea for short-term climate prediction of number of rainstorm days in summer. 展开更多
关键词 C5. 0 algorithm NUMBER of RAINSTORM DAYS PREDICTION model
在线阅读 下载PDF
基于C5.0决策树算法的测绘遥感图像信息自动分类方法 被引量:2
3
作者 谢平 《自动化应用》 2025年第2期96-98,101,共4页
常规的测绘遥感图像信息自动分类方法主要使用随机森林-支持向量机(RF-SVM)融合模型提取图像信息特征,易受预期任务动态改变影响,导致分类评估指标不佳,因此,提出了一种基于C5.0决策树算法的测绘遥感图像信息自动分类方法。降维提取测... 常规的测绘遥感图像信息自动分类方法主要使用随机森林-支持向量机(RF-SVM)融合模型提取图像信息特征,易受预期任务动态改变影响,导致分类评估指标不佳,因此,提出了一种基于C5.0决策树算法的测绘遥感图像信息自动分类方法。降维提取测绘遥感图像信息特征,利用决策树算法进行图像信息自动分类属性度量,实现测绘遥感图像信息的自动分类。结果表明,该设计方法的Producer's Accuracy、User's Accuracy、Overall Accuracy、Kappa均较高,分类效果较好,具有一定的应用价值。 展开更多
关键词 c5.0决策树算法 测绘遥感 图像信息 自动分类 随机森林-支持向量机
在线阅读 下载PDF
A 3-Dimensional Cargo Loading Algorithm for the Conveyor-Type Loading System
4
作者 Hyeonbin Jeong Young Tae Ryu +1 位作者 Byung Duk Song Sang-Duck Lee 《Computer Modeling in Engineering & Sciences》 2025年第3期2739-2769,共31页
This paper proposes a novel cargo loading algorithm applicable to automated conveyor-type loading systems.The algorithm offers improvements in computational efficiency and robustness by utilizing the concept of discre... This paper proposes a novel cargo loading algorithm applicable to automated conveyor-type loading systems.The algorithm offers improvements in computational efficiency and robustness by utilizing the concept of discrete derivatives and introducing logistics-related constraints.Optional consideration of the rotation of the cargoes was made to further enhance the optimality of the solutions,if possible to be physically implemented.Evaluation metrics were developed for accurate evaluation and enhancement of the algorithm’s ability to efficiently utilize the loading space and provide a high level of dynamic stability.Experimental results demonstrate the extensive robustness of the proposed algorithm to the diversity of cargoes present in Business-to-Consumer environments.This study contributes practical advancements in both cargo loading optimization and automation of the logistics industry,with potential applications in last-mile delivery services,warehousing,and supply chain management. 展开更多
关键词 3-dimensional loading automated loading system B2C logistics cargo loading algorithm conveyortype loading
在线阅读 下载PDF
基于改进动麦优化模糊C-均值的WSN分簇信誉路由算法
5
作者 韩冰青 温锦笑 《计算机应用研究》 北大核心 2026年第1期240-246,共7页
针对无线传感器网络中分簇不均、节点能耗高及路由安全性低等问题,提出一种基于改进动麦优化模糊C-means的WSN分簇信誉路由算法(IFCAOR)。首先利用改进的动麦算法优化模糊C-means算法的初始聚类中心,提高网络分簇效果。其次,在簇首选举... 针对无线传感器网络中分簇不均、节点能耗高及路由安全性低等问题,提出一种基于改进动麦优化模糊C-means的WSN分簇信誉路由算法(IFCAOR)。首先利用改进的动麦算法优化模糊C-means算法的初始聚类中心,提高网络分簇效果。其次,在簇首选举阶段,综合节点能量、距离等因素,动态选择簇首,实现负载均衡。最后,在数据传输阶段,采用单多跳轮询机制,并结合中继节点的负载、信誉值和路径衰减等构建路由适应度函数,利用改进动麦算法规划高效安全的传输路由,降低节点能耗并提高路由安全性。仿真结果表明,IFCAOR算法的网络生命周期较LEACH、IFCRA和HMABFOA分别提升93%、49.6%和34.3%,IFCAOR算法能有效平衡网络负载,延长网络生命周期。 展开更多
关键词 无线传感器网络 模糊C-均值 动麦优化算法 分簇路由 能耗均衡
在线阅读 下载PDF
交通事故严重程度C5.0决策树预测模型 被引量:21
6
作者 孙轶轩 邵春福 +1 位作者 赵丹 欧阳松寿 《长安大学学报(自然科学版)》 EI CAS CSCD 北大核心 2014年第5期109-116,共8页
根据中国现行交通事故严重程度分类与事故信息数据分布特征,基于C5.0决策树方法,选取某省会城市城区及周边重点公路16 009起交通事故现场数据,分别将事故严重程度输出变量按照2分类和3分类,输入变量按照空间属性、涉事驾驶人及车辆属性... 根据中国现行交通事故严重程度分类与事故信息数据分布特征,基于C5.0决策树方法,选取某省会城市城区及周边重点公路16 009起交通事故现场数据,分别将事故严重程度输出变量按照2分类和3分类,输入变量按照空间属性、涉事驾驶人及车辆属性和全属性,建立事故严重程度预测模型,生成相应规则集并利用测试样本进行检验和模型对比。研究结果表明:2分类和3分类事故严重程度预测模型精度分别为70%和61%,多模型综合优度有所提升;实证规则集揭示了影响事故严重程度分类的因素主要有,碰撞类型、道路属性、事故致因和驾驶人类型等。 展开更多
关键词 交通工程 交通事故严重程度 预测模型 数据挖掘 决策树 c5.0算法
原文传递
基于C5.0决策树算法的西北干旱区土地覆盖分类研究——以甘肃省武威市为例 被引量:32
7
作者 齐红超 祁元 徐瑱 《遥感技术与应用》 CSCD 北大核心 2009年第5期648-653,I0005,共7页
西北干旱区面积广阔,由于土地利用类型多样,成因复杂,对环境变化敏感、变化过程快、幅度大、景观差异明显等特点,在影像上表现出的"同物异谱"现象明显;利用常规目视解译、监督非监督分类、人工参与的决策树分类等方法在效率... 西北干旱区面积广阔,由于土地利用类型多样,成因复杂,对环境变化敏感、变化过程快、幅度大、景观差异明显等特点,在影像上表现出的"同物异谱"现象明显;利用常规目视解译、监督非监督分类、人工参与的决策树分类等方法在效率或精度等方面各有其缺陷。采用机器学习C5.0决策树算法,综合利用地物波谱、NDVI、TC、纹理等信息,根据样本数据自动挖掘分类规则并对整个研究区进行地物分类。机器学习的决策树可以挖掘出更多的分类规则,C5.0算法对采样数据的分布没有要求,可以处理离散和连续数据,生成的规则易于理解,分类精度高,可以满足西北干旱区大面积的土地利用/覆被变化制图的需要。 展开更多
关键词 c5.0算法 西北干旱区 土地覆被 See5.0 NLCD
原文传递
C5.0算法的改进及应用 被引量:12
8
作者 罗丽娟 段隆振 +1 位作者 段文影 刘萍 《南昌大学学报(工科版)》 CAS 2017年第1期92-97,共6页
C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建... C5.0算法是一种直观、效率高的分类方法,但该算法存在信息增益率计算复杂、容易出现过拟合和决策树偏倚的问题。针对这些问题,通过公式的转换简化信息增益率的计算过程,在剪枝过程采用了损失矩阵和置信区间的结合进行剪枝判断,以及对建立的多个模型的权重进行调整,提出了一种新的C5.0改进算法,并将其应用于信贷逾期预测上。使用借款人的历史还款数据进行实验,并与其他算法进行比较,结果表明:C5.0改进算法相比其他算法具有更高的准确率和效率。 展开更多
关键词 c5.0算法 信息增益率 置信区间 权重调整 信贷逾期
在线阅读 下载PDF
基于C5.0算法的胃癌生存预测模型研究 被引量:6
9
作者 黄志刚 刘虹 +1 位作者 刘娟 张岐山 《南京信息工程大学学报(自然科学版)》 CAS 2017年第4期406-410,共5页
我国的胃癌发病率高,每年新增胃癌患者占全世界每年新增数量的42%,胃癌成为我国恶性肿瘤防控的重点.本文针对胃癌数据的特征,给出数据预处理和集成方法;采用C5.0分类算法,构建了胃癌生存预测模型,并首次采用美国癌症研究所的SEER数据库... 我国的胃癌发病率高,每年新增胃癌患者占全世界每年新增数量的42%,胃癌成为我国恶性肿瘤防控的重点.本文针对胃癌数据的特征,给出数据预处理和集成方法;采用C5.0分类算法,构建了胃癌生存预测模型,并首次采用美国癌症研究所的SEER数据库进行预测实验.实验结果表明:C5.0预测的精确度、特异性均高于BP-神经网络算法;胃癌患者的出生地点与最终的存活状态之间存在较强的相关性.该研究是数据挖掘技术在医学领域的一个实际应用,对胃癌的临床诊断具有一定的参考价值,可为医生制定合理的治疗和预防方案提供一定参考. 展开更多
关键词 数据挖掘 c5.0分类算法 胃癌 生存预测 SEER数据库
在线阅读 下载PDF
改进Relief-C5.0的恶意域名检测算法 被引量:7
10
作者 马栋林 张澍寰 赵宏 《计算机工程与应用》 CSCD 北大核心 2022年第11期100-106,共7页
针对目前恶意域名检测算法中分类模型计算复杂度较大、实时性不强以及准确率不高等问题,提出了Rf-C5(Relief-C5.0)恶意域名检测算法模型。提取待测域名的全局URL特征,根据提取的特征按照改进的Relief算法进行权重计算,并依据权重值进行... 针对目前恶意域名检测算法中分类模型计算复杂度较大、实时性不强以及准确率不高等问题,提出了Rf-C5(Relief-C5.0)恶意域名检测算法模型。提取待测域名的全局URL特征,根据提取的特征按照改进的Relief算法进行权重计算,并依据权重值进行优先级排序;选取权重值排名前20的关键特征作为C5.0分类器的输入端,进行合法域名与恶意域名的分类。实验结果表明,在大样本数据集下,Rf-C5模型与当前主流恶意域名检测算法相比,在提高平均检测速率的基础上,检测准确率提高了1.58~4.91个百分点。 展开更多
关键词 恶意域名 URL特征 改进的Relief算法 c5.0分类器
在线阅读 下载PDF
基于C5.0算法的小额网贷平台的风险监控研究 被引量:5
11
作者 王茂光 葛蕾蕾 赵江平 《中国管理科学》 CSSCI 北大核心 2016年第S1期345-352,共8页
近年来,互联网金融在国内发展迅速,各种类型的小额网贷平台更是层出不穷,但是随着平台跑路,欺诈等各种问题的涌现,暴露出对小额网贷平台监管的不足。本文以C5.0决策树算法为核心建立起风险监控模型,首先利用大数据技术抓取平台数据、公... 近年来,互联网金融在国内发展迅速,各种类型的小额网贷平台更是层出不穷,但是随着平台跑路,欺诈等各种问题的涌现,暴露出对小额网贷平台监管的不足。本文以C5.0决策树算法为核心建立起风险监控模型,首先利用大数据技术抓取平台数据、公开信息数据和征信机构数据,然后对数据分析,筛选关键指标体系,建立了一种风控模型,最后评估和验证模型及算法的有效性,并通过对模型的参数进行调整,提出以保证整体错误率的前提下,尽可能的降低α错误率的评价标准。通过实验发现,该风控模型对问题平台有着很好的预测能力。 展开更多
关键词 小额网贷 风险监控 c5.0决策树算法 α错误率
原文传递
基于C5.0与Apriori算法的森林生物量等级评价与因子关联分析 被引量:2
12
作者 王霓虹 高萌 +1 位作者 李丹 刘立臣 《中南林业科技大学学报》 CAS CSCD 北大核心 2015年第3期1-6,共6页
针对生物量影响因子量化研究较少、方法单一及区域生物量评价不足且基于单个树种生物量模型进行评价时工作量过大的问题,以孟家岗林场的三类小班清查数据为基础,选取与生物量水平相关的11个因子,利用C5.0算法进行生物量决策树建模,并进... 针对生物量影响因子量化研究较少、方法单一及区域生物量评价不足且基于单个树种生物量模型进行评价时工作量过大的问题,以孟家岗林场的三类小班清查数据为基础,选取与生物量水平相关的11个因子,利用C5.0算法进行生物量决策树建模,并进一步利用Apriror算法进行生物量强影响因子的关联规则挖掘。结果表明:生物量决策树模型的分类预测精度为88.78%,生物量影响因子的量化结果分别为树高(0.348)、胸径(0.225)、林分类型(0.196)、龄级(0.162)、郁闭度(0.134)、坡度(0.096)、海拔(0.074)、坡向(0.065)、立地类型(0.052)和坡位(0.037);得到707条置信度在80%以上、支持度在10%以上的因子关联规则,揭示了生物量影响因子间的隐含关联关系。建立的生物量决策树模型能为快速的区域生物量预测和评价提供模型参考,建立的关联规则评估模型能够为以碳汇为目标的森林生产与经营提供客观评价指标。 展开更多
关键词 森林生物量评价 生物量影响因子 c5.0算法 APRIORI算法 关联分析
在线阅读 下载PDF
基于C5.0的遥感影像决策树分类实验研究 被引量:15
13
作者 白秀莲 巴雅尔 哈斯其其格 《遥感技术与应用》 CSCD 北大核心 2014年第2期338-343,共6页
决策树算法是一种非参数化、非线性的监督分类法。以2010年8月1日Landsat TM影像为基础遥感信息源,以内蒙古自治区赤峰市中部巴林右旗、林西县、克什克腾旗、翁牛特旗交汇处的区域为研究区,通过多次修改完善训练样本数据集,然后把6个原... 决策树算法是一种非参数化、非线性的监督分类法。以2010年8月1日Landsat TM影像为基础遥感信息源,以内蒙古自治区赤峰市中部巴林右旗、林西县、克什克腾旗、翁牛特旗交汇处的区域为研究区,通过多次修改完善训练样本数据集,然后把6个原始波段和NDVI、主成分分析后的前3个主分量、常用8个纹理特征以及3个地形特征等共21个特征变量组合成5个不同特征变量组合,采用典型决策树算法C5.0进行了遥感影像分类实验,与最大似然分类结果进行对比。结果表明:C5.0决策树的分类结果优于最大似然结果,尤其是特征变量组合恰当的时候,能够有效利用相关辅助信息,因而最终的分类结果更能满足用户需求。 展开更多
关键词 遥感影像 决策树 分类 c5.0
原文传递
基于C5.0决策树分类算法的ETM+影像信息提取 被引量:32
14
作者 温兴平 胡光道 杨晓峰 《地理与地理信息科学》 CSCD 北大核心 2007年第6期26-29,共4页
利用C5.0决策树算法对ETM+影像进行信息提取,通过与其他分类方法提取结果的对比,得出C5.0决策树分类算法精度较高。大气校正与数据融合可明显提高分类精度,利用经过NDVI、NDBI、缨帽变换处理后的影像组合数据进行信息提取可进一步提高... 利用C5.0决策树算法对ETM+影像进行信息提取,通过与其他分类方法提取结果的对比,得出C5.0决策树分类算法精度较高。大气校正与数据融合可明显提高分类精度,利用经过NDVI、NDBI、缨帽变换处理后的影像组合数据进行信息提取可进一步提高分类精度。研究发现,C5.0决策树算法用未处理的资料生成决策树的效果较差,而经大气校正和数据融合后计算出NDVI、NDBI及缨帽变换的前3个分量的组合数据生成的决策树深度最小,并且分类精度最高。 展开更多
关键词 c5.0决策树算法 ETM+遥感影像 信息提取
在线阅读 下载PDF
基于C5.0算法的森林资源变化检测方法研究——以山东省徂徕山林区为例 被引量:11
15
作者 王志慧 李世明 张艺伟 《西北林学院学报》 CSCD 北大核心 2011年第5期185-191,共7页
以山东省徂徕山林场为试验区,利用两时相的TM与ETM+遥感数据对该地区的针叶林、阔叶林等森林资源的变化进行研究。将基于C5.0算法的决策树分类方法应用于森林变化检测,并对3种检测方案进行试验比较:(1)以单一时相图像作为数据源并各自分... 以山东省徂徕山林场为试验区,利用两时相的TM与ETM+遥感数据对该地区的针叶林、阔叶林等森林资源的变化进行研究。将基于C5.0算法的决策树分类方法应用于森林变化检测,并对3种检测方案进行试验比较:(1)以单一时相图像作为数据源并各自分类,分类后作比较提取变化信息;(2)以两时相图像的原始波段数据作为数据源训练规则,并生成变化检测图;(3)以两时相图像加上邻近相关分析图像作为数据源训练规则,生成变化检测图。试验结果表明,基于C5.0算法的决策树分类可以有效的进行森林变化检测,并且加入邻近相关分析图像后的变化检测精度达到最高。 展开更多
关键词 变化检测 c5.0 决策树 邻近相关分析
在线阅读 下载PDF
基于Boosting算法的C5.0决策树不平衡数据分类算法 被引量:5
16
作者 王植 张珏 《河南科学》 2023年第1期7-12,共6页
为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验... 为了改进不平衡数据的分类性能,提出一种可自动确定迭代参数trail值的集成C5.0决策树算法.首先,算法引入boosting集成框架到C5.0决策树算法中,从而生成新的集成分类器;其次,算法使用网格搜索法在一定范围内自动确定trail参数的值.实验结果表明,该算法在不平衡数据上的分类性能指标G-mean和MCC上具有优势. 展开更多
关键词 类不平衡问题 集成算法 c5.0决策树算法 网格搜索算法
在线阅读 下载PDF
基于C5.0决策树算法的元胞自动机土地利用变化模拟模型 被引量:30
17
作者 柯新利 边馥苓 《长江流域资源与环境》 CAS CSSCI CSCD 北大核心 2010年第4期403-408,共6页
C5.0决策树算法可以揭示数据中的结构化信息,建立直观、易于理解的树形结构,可以用于元胞自动机转换规则的获取。提出了基于C5.0决策树算法的元胞自动机模型,分析了模型构建的理论和原理以及实现方法。在此基础上,以杭州市城市用地演变... C5.0决策树算法可以揭示数据中的结构化信息,建立直观、易于理解的树形结构,可以用于元胞自动机转换规则的获取。提出了基于C5.0决策树算法的元胞自动机模型,分析了模型构建的理论和原理以及实现方法。在此基础上,以杭州市城市用地演变为例,利用C5.0决策树算法从已有的城市用地及其影响因子数据中挖掘出城市用地的演变规则,并将获得的转换规则应用到元胞自动机模型中进行城市用地演变的动态模拟与预测。结果表明:(1)利用C5.0决策树算法获取转换规则可以在较低采样率的前提下保证具有较高的精度;(2)与其它获取元胞自动机转换规则的方法相比,C5.0决策树算法生成的规则清晰明确,很适合用来获取元胞转换规则;(3)基于C5.0决策树算法的元胞自动机模型在模拟城市用地演变方面具有较高的模拟精度,模拟结果可靠。 展开更多
关键词 c5.0决策树 元胞自动机 土地利用变化
原文传递
基于C5.0决策树的船舶交通事故致因分析模型及应用 被引量:8
18
作者 黄常海 沈佳 +3 位作者 朱冉超 齐绪存 郑菲 陆浩 《中国安全科学学报》 CAS CSCD 北大核心 2022年第10期90-99,共10页
为减少船舶交通事故的发生,对船舶交通事故的致因展开研究。首先,以事故类型作为输出变量,以船舶交通事故数据为样本,构建基于C5.0算法的船舶交通事故致因路径分析模型;然后,确定事故致因路径分析有效性评价指标;再次,运用“2-4”模型(2... 为减少船舶交通事故的发生,对船舶交通事故的致因展开研究。首先,以事故类型作为输出变量,以船舶交通事故数据为样本,构建基于C5.0算法的船舶交通事故致因路径分析模型;然后,确定事故致因路径分析有效性评价指标;再次,运用“2-4”模型(24Model),对所识别出的不同类型事故致因路径因果关系进一步分析,提出通过切断事故潜在致因路径的船舶交通事故预控措施;最后,将894起船舶交通事故数据样本随机分为80%的训练集和20%的测试集,应用所提出的模型进行分析。结果表明:所提出的模型可以生成不同类型事故的分类规则集,模型分类正确率达到90%以上,且模型具有强的泛化能力。结合分类规则集构建的船舶交通事故致因链为船舶交通事故的防范提供定量化的理论依据。 展开更多
关键词 c5.0算法 决策树 船舶交通事故 致因路径 致因分析 “2-4”模型(24Model)
原文传递
基于ROSE和C5.0算法的打鼾者OSAHS初筛模型 被引量:3
19
作者 杜国栋 吕云辉 +4 位作者 马磊 相艳 邵党国 雷强 胡蓉 《计算机工程与应用》 CSCD 北大核心 2018年第3期250-254,共5页
使用医疗信息系统的数据进行睡眠呼吸暂停低通气综合征(OSAHS)预测和分析过程中,存在不平衡数据问题。为此,在现有临床研究的基础上,提出了一种基于ROSE(Random Over Sampling Examples)和C5.0算法的初筛模型。利用收集到的人体测量学... 使用医疗信息系统的数据进行睡眠呼吸暂停低通气综合征(OSAHS)预测和分析过程中,存在不平衡数据问题。为此,在现有临床研究的基础上,提出了一种基于ROSE(Random Over Sampling Examples)和C5.0算法的初筛模型。利用收集到的人体测量学指标数据,通过数据预处理,删除异常值并填补缺失值。然后采用ROSE算法对数据进行平衡,利用C5.0分类器对平衡后的数据构建筛查模型,通过十则交叉验证的方法检验模型的筛查效果。实验结果表明,使用该模型进行打鼾患者的OSAHS筛查,可以有效地提高筛查效率。 展开更多
关键词 不均衡数据 初筛模型 随机过采样(ROSE) c5.0决策树
在线阅读 下载PDF
基于C5.0决策树和时序HJ-1A/B CCD数据的神农架林区植被分类 被引量:13
20
作者 李梦莹 胡勇 王征禹 《长江流域资源与环境》 CAS CSSCI CSCD 北大核心 2016年第7期1070-1077,共8页
我国神农架林区海拔高、气候复杂,森林类型多样,结构破碎,森林遥感分类难度较大。将2013年时间序列HJ-1A/B CCD遥感影像作为数据源,计算出植被指数(NDVI、DVI、RVI)和主成分第一分量(PC1),使用DEM数据生成地形因子(高程、坡度、坡... 我国神农架林区海拔高、气候复杂,森林类型多样,结构破碎,森林遥感分类难度较大。将2013年时间序列HJ-1A/B CCD遥感影像作为数据源,计算出植被指数(NDVI、DVI、RVI)和主成分第一分量(PC1),使用DEM数据生成地形因子(高程、坡度、坡向),构建植被分类时序因子集。运用C5.0决策树分类法将神农架林区植被细分为七类:针叶林;针阔混交林;落叶阔叶林;常绿和落叶阔叶混交林;常绿阔叶林;灌丛和草甸。结果表明:该方法的总体精度为72.7%,Kappa系数为0.67;在6~8月,针叶林、草甸和灌丛的植被指数明显低于常绿阔叶林、常绿和落叶阔叶混交林、落叶阔叶林和针阔混交林,对分类的贡献较大,称为植被分类的"窗口期"。PC1、NDVI和高程因子对神农架林地的区分度较高,而坡度、坡向和RVI因子对分类帮助不大。作为一种智能分类方法,C5.0决策树分类方法应用于30m分辨率的时间序列HJ-1A/B CCD数据,能够将地貌复杂的神农架林区植被分为七类,提高了类别精度,具有更高的应用价值。 展开更多
关键词 c5.0决策树 HJ-1A/B CCD数据 神农架林区 时间序列 森林次级分类
原文传递
上一页 1 2 112 下一页 到第
使用帮助 返回顶部