期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
Mapping landslide susceptibility at the Three Gorges Reservoir, China, using gradient boosting decision tree,random forest and information value models 被引量:14
1
作者 CHEN Tao ZHU Li +3 位作者 NIU Rui-qing TRINDER C John PENG Ling LEI Tao 《Journal of Mountain Science》 SCIE CSCD 2020年第3期670-685,共16页
This work was to generate landslide susceptibility maps for the Three Gorges Reservoir(TGR) area, China by using different machine learning models. Three advanced machine learning methods, namely, gradient boosting de... This work was to generate landslide susceptibility maps for the Three Gorges Reservoir(TGR) area, China by using different machine learning models. Three advanced machine learning methods, namely, gradient boosting decision tree(GBDT), random forest(RF) and information value(InV) models, were used, and the performances were assessed and compared. In total, 202 landslides were mapped by using a series of field surveys, aerial photographs, and reviews of historical and bibliographical data. Nine causative factors were then considered in landslide susceptibility map generation by using the GBDT, RF and InV models. All of the maps of the causative factors were resampled to a resolution of 28.5 m. Of the 486289 pixels in the area,28526 pixels were landslide pixels, and 457763 pixels were non-landslide pixels. Finally, landslide susceptibility maps were generated by using the three machine learning models, and their performances were assessed through receiver operating characteristic(ROC) curves, the sensitivity, specificity,overall accuracy(OA), and kappa coefficient(KAPPA). The results showed that the GBDT, RF and In V models in overall produced reasonable accurate landslide susceptibility maps. Among these three methods, the GBDT method outperforms the other two machine learning methods, which can provide strong technical support for producing landslide susceptibility maps in TGR. 展开更多
关键词 MAPPING LANDSLIDE SUSCEPTIBILITY gradient BOOSTING DECISION tree Random forest Information value model Three Gorges Reservoir
原文传递
Linear and Nonlinear Trading Models with Gradient Boosted Random Forests and Application to Singapore Stock Market
2
作者 Qin Qin Qing-Guo Wang +1 位作者 Jin Li Shuzhi Sam Ge 《Journal of Intelligent Learning Systems and Applications》 2013年第1期1-10,共10页
This paper presents new trading models for the stock market and test whether they are able to consistently generate excess returns from the Singapore Exchange (SGX). Instead of conventional ways of modeling stock pric... This paper presents new trading models for the stock market and test whether they are able to consistently generate excess returns from the Singapore Exchange (SGX). Instead of conventional ways of modeling stock prices, we construct models which relate the market indicators to a trading decision directly. Furthermore, unlike a reversal trading system or a binary system of buy and sell, we allow three modes of trades, namely, buy, sell or stand by, and the stand-by case is important as it caters to the market conditions where a model does not produce a strong signal of buy or sell. Linear trading models are firstly developed with the scoring technique which weights higher on successful indicators, as well as with the Least Squares technique which tries to match the past perfect trades with its weights. The linear models are then made adaptive by using the forgetting factor to address market changes. Because stock markets could be highly nonlinear sometimes, the Random Forest is adopted as a nonlinear trading model, and improved with Gradient Boosting to form a new technique—Gradient Boosted Random Forest. All the models are trained and evaluated on nine stocks and one index, and statistical tests such as randomness, linear and nonlinear correlations are conducted on the data to check the statistical significance of the inputs and their relation with the output before a model is trained. Our empirical results show that the proposed trading methods are able to generate excess returns compared with the buy-and-hold strategy. 展开更多
关键词 Stock modeling SCORING TECHNIQUE Least Square TECHNIQUE RANDOM forest gradient Boosted RANDOM forest
暂未订购
基于机器学习的Budyko框架流域时变特征参数估计 被引量:1
3
作者 薛联青 陈雨欣 +1 位作者 刘远洪 杨明杰 《水资源保护》 北大核心 2025年第4期10-18,41,共10页
为分析黄河中游Budyko框架流域特征参数的时空变化,并捕捉不同因素对流域特征参数的影响,基于黄河中游8个子流域的径流、气象和人类活动数据,分区构建多元线性回归(MLR)、梯度提升(GB)和随机森林(RF)模型,对傅抱璞方程中的流域特征参数... 为分析黄河中游Budyko框架流域特征参数的时空变化,并捕捉不同因素对流域特征参数的影响,基于黄河中游8个子流域的径流、气象和人类活动数据,分区构建多元线性回归(MLR)、梯度提升(GB)和随机森林(RF)模型,对傅抱璞方程中的流域特征参数ω进行模拟。通过交叉验证选择表现最优的模型,识别对ω影响显著的主要控制因素,并进一步将最优模型纳入水热耦合平衡方程,构建时变Budyko框架,量化气候变化和下垫面变化对径流的贡献率。结果表明:3种模型中,RF模型在模拟ω时优于MLR和GB模型;1980—2019年各子流域ω值均呈增大趋势,ω主要受不透水面面积、人口和地区生产总值等人类活动因素的控制,在气候因素中潜在蒸散发是重要的控制因素;下垫面变化是黄河中游大多数子流域径流变化的主要驱动因素,然而气候变化对沁河子流域的影响略强于下垫面变化。 展开更多
关键词 Budyko框架 流域特征参数 多元线性回归模型 梯度提升模型 随机森林模型 黄河中游
在线阅读 下载PDF
Multi-Level, Multi-Scale Modeling and Predictive Mapping for Jaguars in the Brazilian Pantanal
4
作者 Eve Bohnett Dave Hulse +1 位作者 Bilal Ahmad Thomas Hoctor 《Open Journal of Ecology》 2020年第5期243-263,共21页
Multi-level multi-scale resource selection models using machine learning were compared and contrasted for generating predictive maps of jaguar habitat (Panthera onca) in the Brazilian Pantanal. Multiple spatial scales... Multi-level multi-scale resource selection models using machine learning were compared and contrasted for generating predictive maps of jaguar habitat (Panthera onca) in the Brazilian Pantanal. Multiple spatial scales and temporal movement levels were run within several analytical modeling frameworks for comparison. Included in the analysis were multi-scale raster grains (30 m, 90 m, 180 m, 360 m, 720 m, 1440 m) and GPS collaring temporal movement levels (point, path, and step). Various analytical methods were used for comparison of models that could accommodate data structural levels (group, individual, case-control). Models compared included conditional logistic regression, generalized additive modeling (GAM), and classification regression trees, such as random forests (RF) and gradient boosted regression tree (GBM). The goals of the study were to discuss the potential and limitations for machine learning methods using GPS collaring data to produce predictive habitat suitability mapping using the various scales and levels available. Results indicated that choosing the appropriate temporal level and raster scale improved model outputs. Overall, larger level analytical modeling frameworks and those that used multi-scale raster grains showed the best model evaluation with the inherent condition that they predict a broader scale and subset of data. The identification of the appropriate spatial scale, temporal scale and statistical model need careful consideration in predictive mapping efforts. 展开更多
关键词 Machine Learning Movement Ecology HABITAT SELECTION Resource SELECTION MULTIPLE Levels MULTIPLE Scales PREDICTIVE models gradient Boosting Method Random forest
在线阅读 下载PDF
比较多种机器学习模型预测肺移植术后受者生存
5
作者 史灵芝 刘亚灵 +7 位作者 严浩吉 喻赠玮 侯森林 刘明昭 杨航 吴波 田东 陈静瑜 《器官移植》 北大核心 2025年第2期264-271,共8页
目的 比较不同机器学习算法构建的预后模型在预测肺移植(LTx)受者生存期方面的性能和表现。方法 回顾性收集483例行LTx手术的受者资料,所有受者按7∶3的比例分为训练集和验证集,将收集到的24个变量基于变量重要性(VIMP)进行筛选,利用随... 目的 比较不同机器学习算法构建的预后模型在预测肺移植(LTx)受者生存期方面的性能和表现。方法 回顾性收集483例行LTx手术的受者资料,所有受者按7∶3的比例分为训练集和验证集,将收集到的24个变量基于变量重要性(VIMP)进行筛选,利用随机生存森林(RSF)和极端梯度提升树(XGBoost)构建预后模型,使用综合曲线下面积(iAUC)和时间依赖曲线下面积(t AUC)进行模型性能评估。结果 训练集和验证集的各变量差异均无统计学意义。基于VIMP筛选排名前15的变量用于建模并确定重症监护室(ICU)住院时间为最重要的因素。与XGBoost模型相比,RSF模型在预测受者生存期方面表现出更好的性能(i AUC0.773比0.723)。在预测受者6个月生存期(tAUC6个月0.884比0.809,P=0.009)和1年生存期(tAUC1年0.896比0.825,P=0.013)方面,RSF模型也表现出更好的性能。基于两种算法的预测截断值,将LTx术后受者分为高风险组和低风险组,两种模型的生存分析结果均显示高风险组受者的生存率低于低风险组(P<0.001)。结论 与XGBoost相比,基于RSF算法开发的机器学习预后模型可以更好地预测LTx受者的生存期。 展开更多
关键词 肺移植 机器学习 预测模型 随机生存森林 极端梯度提升树 生存期 比例风险回归模型 重症监护室
暂未订购
基于有监督机器学习模型的贷款违约概率预测研究
6
作者 李青 彭飞 张馨月 《金融发展评论》 2025年第6期1-11,共11页
通过机器学习算法对信贷违约概率进行预测是本文的研究重点。本文对法人金融机构贷款数据进行特征分析,并利用机器学习算法对违约概率进行预测。本文提出使用有监督机器学习算法对贷款潜在违约概率进行预测,该类机器学习算法在数据分析... 通过机器学习算法对信贷违约概率进行预测是本文的研究重点。本文对法人金融机构贷款数据进行特征分析,并利用机器学习算法对违约概率进行预测。本文提出使用有监督机器学习算法对贷款潜在违约概率进行预测,该类机器学习算法在数据分析领域中被广泛使用,在分类预测中具有较好的应用场景和成功案例。本文使用三种常规的有监督机器学习模型,即:逻辑回归(LR,logistics regression)、随机森林(RF,Random Forest)、梯度提升决策树(GBDT,Gradient Boosting Decision Tree),并在此基础上使用梯度提升决策树+逻辑回归(GBDT+LR)的组合模型,基于法人金融机构贷款数据中的不良贷款数据进行训练,并测试准确率。实验模型中,测试结果最好的是梯度提升决策树+逻辑回归(GBDT+LR)组合模型,测试准确率达到96.36%,AUC值为0.986。 展开更多
关键词 机器学习 逻辑回归模型 梯度提升决策树模型 随机森林模型 潜在贷款违约概率预测
原文传递
基于机器学习算法构建新型冠状病毒感染重症病人的死亡预测模型 被引量:1
7
作者 桑珍珍 李勇 《安徽医药》 2025年第4期747-753,I0003,I0004,共9页
目的探讨影响新型冠状病毒感染(novel coronavirus pneumonia;别名corona virus disease 2019,COVID-19)重症病人预后的危险因素,建立预测模型并进行验证,进而准确地评估COVID-19重症病人的不良预后。方法收集2022年11月1日至2023年7月... 目的探讨影响新型冠状病毒感染(novel coronavirus pneumonia;别名corona virus disease 2019,COVID-19)重症病人预后的危险因素,建立预测模型并进行验证,进而准确地评估COVID-19重症病人的不良预后。方法收集2022年11月1日至2023年7月1日沧州市中心医院收治的526例COVID-19重症病人的临床指标与结局(院内28 d内死亡或存活)。用于R软件“caret”包,将526例病人按7∶3的比例拆分为两组:训练集(n=369)用于模型训练,测试集(n=157)用于模型验证。利用极端梯度提升(XGBoost)、随机森林(RF)2种机器学习算法构建病人临床结局的预测模型,应用SHAP进行XGBoost模型可解释性分析,分别得出影响病人预后的变量。将RF和XGBoost得出的变量取交集得到差异有统计学意义的变量,进而构建决策树模型。最后,在训练集和测试集上利用受试者操作特征曲线(ROC曲线)、曲线下面积(AUC)评估所决策树模型的预测性能。结果通过XGBoost模型得到与院内死亡相关的变量15个,随机森林模型得到与院内死亡相关的变量23个,两种模型取交集得到13个与院内死亡相关性最强的重要变量(白细胞介素-6、N端脑钠肽前体、白蛋白、超敏肌钙蛋白I、淋巴细胞、血乳酸、α-羟丁氨酸、肌酸激酶同工酶、动脉血氧分压、年龄、尿素氮、血红蛋白、乳酸脱氢酶)。用这13个重要变量构建决策树模型,得出2个与病人死亡最相关的变量(白细胞介素-6、淋巴细胞),死亡组病人的白细胞介素-6为155.48(42.81,691.3)ng/L,显著高于存活组15.38(10.51,31.11)ng/L(Z=37387.50,P<0.001)。死亡组病人的淋巴细胞为5.4(3.3,12.6)%,显著低于存活组13.5(8.62,22.28)%(Z=10584.50,P<0.001)。在训练集上的决策树模型预测COVID-19重症病人死亡的AUC为0.86,在测试集上的AUC为0.84。结论基于XGBoost和随机森林这2种机器学习方法构建的决策树模型能够更准确地评估COVID-19重症病人的不良预后。 展开更多
关键词 机器学习 新型冠状病毒感染 森林图 人工智能 极端梯度提升(XGBoost) 预后 预测模型
在线阅读 下载PDF
基于机器学习方法预测3D打印零件的性能
8
作者 洪学银 高尚 《中国塑料》 北大核心 2025年第7期72-79,共8页
采用拉丁超立方实验设计,研究了层高、壁厚、顶底厚、顶底线条方向、填充密度、填充线条方向、打印速度、挤出温度、床温、工作空间温度10种熔融沉积建模(FDM)工艺参数对丙烯腈-丁二烯-苯乙烯共聚物(ABS)零件拉伸性能的影响,对比了人工... 采用拉丁超立方实验设计,研究了层高、壁厚、顶底厚、顶底线条方向、填充密度、填充线条方向、打印速度、挤出温度、床温、工作空间温度10种熔融沉积建模(FDM)工艺参数对丙烯腈-丁二烯-苯乙烯共聚物(ABS)零件拉伸性能的影响,对比了人工神经元网络(ANN)、随机森林(RF)和梯度提升算法(GB)3种机器学习方法预测拉伸性能的准确性。结果表明,ANN预测拉伸强度和断裂伸长率的相关系数R仅为0.883 5和0.892 4,在训练和测试数据集上,预测的均方误差(MSE)在5~10和20~24之间;RF预测的R值为0.913 6和0.924 0,MSE在3~8和15~20之间;GB预测准确性最高,R值为0.975 9和0.981 2,MSE最低,在1~4和8~10之间。在10种工艺参数中,在采用RF模型时,拉伸性能的显著影响因素为填充密度、壁厚、填充线条方向和顶底厚,在采用GB模型时,拉伸性能的显著影响因素为填充密度、壁厚、层高和填充线条方向。填充密度是影响拉伸性能最显著的因素,对GB预测结果的影响显著性达到80%左右,远大于RF模型中的40%。 展开更多
关键词 熔融沉积建模 人工神经元网络 随机森林 gradient Boosting 拉伸性能
在线阅读 下载PDF
数字化转型对碳排放强度影响研究——基于广东省的面板数据
9
作者 韩凤彩 邹俊锋 《对外经贸》 2025年第10期45-51,共7页
随着近年来全球气候变化问题的加剧,降低碳排放已成为各国实现可持续发展的重要议题。广东省作为中国经济发达地区之一,是降低碳排放重点地区。而数字化转型则是广东省降低碳排放强度的重要发展方向。为了研究数字化转型对碳排放强度的... 随着近年来全球气候变化问题的加剧,降低碳排放已成为各国实现可持续发展的重要议题。广东省作为中国经济发达地区之一,是降低碳排放重点地区。而数字化转型则是广东省降低碳排放强度的重要发展方向。为了研究数字化转型对碳排放强度的影响,分析2006年至2022年的广东省面板数据,采用梯度提升回归模型和随机森林模型,探讨数字化转型对碳排放强度的影响。研究结果表明,数字化转型显著降低了碳排放强度。此外,在探讨数字化转型对碳排放强度的影响同时还研究了经济发展水平、产业结构、环境规制和对外开放程度等控制变量对碳排放强度的影响,为广东省的绿色低碳发展提供了实证依据和政策建议。 展开更多
关键词 数字化转型 碳排放强度 广东省 梯度提升回归 随机森林
在线阅读 下载PDF
基于海拔梯度的华北落叶松林地上碳储量模型
10
作者 杨昊 周泽宇 +2 位作者 樊雅茹 张梦弢 杨朝晖 《中南林业科技大学学报》 北大核心 2025年第9期159-169,共11页
【目的】海拔梯度是影响山地森林碳储量分布的重要环境因子,但其非线性效应机制及最优海拔区间尚不明确。揭示华北落叶松森林碳储量沿海拔梯度的分布规律,比较不同建模方法的预测性能,并探讨激光雷达技术在森林碳储量评估中的应用潜力... 【目的】海拔梯度是影响山地森林碳储量分布的重要环境因子,但其非线性效应机制及最优海拔区间尚不明确。揭示华北落叶松森林碳储量沿海拔梯度的分布规律,比较不同建模方法的预测性能,并探讨激光雷达技术在森林碳储量评估中的应用潜力。【方法】基于35个样地的野外调查数据和激光雷达数据,分别采用线性回归、多项式回归、混合效应模型和广义可加模型(GAM)对碳储量与海拔关系进行建模与比较,采用留一法交叉验证评估模型的预测性能,并计算标准评价决定系数(R^(2))、标准估计误差(SEE)、平均百分比误差(MPE)等指标。【结果】华北落叶松森林碳储量沿海拔梯度(1900~2500 m)呈现显著的倒“U”形分布模式,最优海拔区间为2000~2200 m,理论最优海拔为2165 m。海拔是森林碳储量变异的主导因子,解释了89.5%的碳储量变异(η^(2)=0.895,P<0.001)。4种建模方法中,GAM模型表现最优(拟合R^(2)=0.907,交叉验证R^(2)=0.888,预测标准误差为10.15 t/hm^(2))。【结论】研究证实了海拔梯度对森林碳储量的非线性效应,GAM模型在复杂生态关系建模方面具有明显优势。激光雷达技术在森林碳储量评估中展现出巨大潜力,为构建山地森林碳汇监测体系提供了技术支撑。研究成果为气候变化背景下的森林适应性管理和基于海拔梯度的精准森林经营提供了科学依据。 展开更多
关键词 森林碳储量 海拔梯度 广义可加模型 激光雷达 华北落叶松
在线阅读 下载PDF
气候变化和人类活动对中国北方旱区植被变绿的定量贡献 被引量:20
11
作者 许丽 高光耀 +4 位作者 王晓峰 陈永喆 周潮伟 王凯 傅伯杰 《生态学报》 CAS CSCD 北大核心 2023年第17期7274-7283,共10页
气候变化和大规模的生态恢复使中国北方旱区植被发生了显著变化,量化气候变化和人类活动对植被动态的相对贡献,对于旱区生态系统管理和应对未来气候变化具有重要意义。目前,中国北方旱区植被变化影响因素的时间动态(2000年大规模生态恢... 气候变化和大规模的生态恢复使中国北方旱区植被发生了显著变化,量化气候变化和人类活动对植被动态的相对贡献,对于旱区生态系统管理和应对未来气候变化具有重要意义。目前,中国北方旱区植被变化影响因素的时间动态(2000年大规模生态恢复工程实施前后)和空间异质性(沿干旱梯度)仍需进一步的定量研究。基于多源数据,采用趋势分析、偏相关分析和随机森林模型等方法,分析了1981-2018年中国北方旱区气候和植被的时空变化规律,量化了2000年前后气候变化和人类活动对植被动态的相对贡献并分析其在干旱梯度上的空间差异性。结果表明:(1)1981-2018年期间,中国北方旱区的叶面积指数(LAI)平均增加速率为(0.0037±0.0443)a^(-1),且增加速率沿干旱梯度增大。2000年前仅10.46%(P<0.05)的地区显著变绿,而2000年后达到36.84%,且植被变绿主要归因于非树木植被。(2)2000年后降水对植被变绿的正效应在不同干旱梯度均增加,而在半干旱区和亚湿润干旱区,温度对植被变绿由正向促进转为负向抑制,而辐射在干旱区由负效应转向正效应。(3)2000年前后,气候变化均主导着植被的动态,贡献率分别为96.07%和73.72%,人类活动的贡献在2000年后进一步增强(从3.93%增加到26.28%),且沿着干旱梯度而增加,其中人类活动对植被变绿的贡献在半干旱地区增加最显著(+0.0289 m^(2)m^(-2)a^(-1),P<0.05)。研究结果可为未来气候变化下中国北方旱区的植被恢复和可持续发展提供科学依据。 展开更多
关键词 植被变绿 气候变化 人类活动 随机森林模型 干旱梯度
在线阅读 下载PDF
4种遥感水深反演机器学习模型的比较 被引量:11
12
作者 沈蔚 孟然 +3 位作者 栾奎峰 饶亚丽 郝李华 纪茜 《海洋测绘》 CSCD 北大核心 2022年第5期68-72,共5页
为探究不同遥感水深反演机器学习模型的差异,以WorldView-2高分辨率多光谱影像与实测水深数据为数据源,应用BP神经网络模型、随机森林模型、梯度提升决策树模型及支持向量机模型开展水深反演实验,对4种水深反演模型的精度进行比较与评... 为探究不同遥感水深反演机器学习模型的差异,以WorldView-2高分辨率多光谱影像与实测水深数据为数据源,应用BP神经网络模型、随机森林模型、梯度提升决策树模型及支持向量机模型开展水深反演实验,对4种水深反演模型的精度进行比较与评价。实验结果表明:机器学习模型反演水深,具有一定精度,平均相对误差(MRE)可优于20%。4种模型中,同为集成学习模型的随机森林模型与梯度提升决策树模型在两个实验区域,反演水深的RMSE值、MRE值与R2值明显优于BP神经网络模型和支持向量机模型,具有更好的浅水水深反演效果和适用性。 展开更多
关键词 多光谱水深反演 随机森林模型 梯度提升决策树模型 BP神经网络模型 支持向量机模型
在线阅读 下载PDF
基于随机森林和XGBoost算法构建心脏骤停患者自主循环恢复后神经功能预后不良的风险预测模型 被引量:8
13
作者 桑珍珍 崔杰 +2 位作者 闫寒 王维峰 庞秀艳 《中国急救医学》 CAS CSCD 2024年第7期577-585,共9页
目的 利用机器学习算法构建预测心脏骤停(CA)患者自主循环恢复(ROSC)后神经功能预后不良的预测模型,探索结局相关因子。方法 回顾性收集2016年1月至2024年1月沧州市中心医院收治的CA行心肺复苏(CPR)后ROSC的患者481例为研究对象。收集... 目的 利用机器学习算法构建预测心脏骤停(CA)患者自主循环恢复(ROSC)后神经功能预后不良的预测模型,探索结局相关因子。方法 回顾性收集2016年1月至2024年1月沧州市中心医院收治的CA行心肺复苏(CPR)后ROSC的患者481例为研究对象。收集患者临床资料,根据患者转出重症监护病房(ICU)时的格拉斯哥-匹兹堡脑功能表现分级(CPC)评分,将其分为预后良好组(GNO,n=158)和预后不良组(PNO,n=323)。481例患者按7∶3随机分为训练集(n=338)和测试集(n=143),训练集用于构建模型,测试集用评价模型效能。利用极端梯度提升(XGBoost)和随机森林(RF)两种机器学习算法构建患者神经功能预后不良的预测模型,分别得出影响患者神经功能预后的变量,应用SHAP进行XGBoost模型可解释性分析。将XGBoost和RF算法得出的变量取交集,再将交集变量进行多因素Logistic回归分析,得到差异有统计学意义的变量,进而构建决策树模型。在训练集和测试集上利用受试者工作特征(ROC)曲线和曲线下面积(AUC)评估决策树模型的预测性能。结果 通过XGBoost模型得到与神经功能预后不良相关的变量15个,RF模型得到与神经功能预后不良相关的变量14个,两种模型取交集得到11个与神经功能预后不良相关的交集变量[视神经鞘直径(ONSD)变化率、神经元特异性烯醇化酶(NSE)、入ICU第3天ONSD(ONSD day3)、心脏骤停至心肺复苏(CA-CPR)时间、ROSC时间、急性生理学与慢性健康状况评价Ⅱ(APACHEⅡ)评分、血肌酐、白蛋白、住ICU时间、血乳酸及年龄]。将这11个交集变量进行多因素Logistic回归分析,结果显示,PNO组与GNO组ONSD变化率、NSE、ONSD day3、ROSC时间及年龄这5个变量差异有统计学意义(P<0.05)。用这5个重要变量构建决策树模型,得出3个与患者神经功能预后不良最相关的变量(NSE、ROSC时间及ONSD变化率),在训练集上的决策树模型预测CA行CPR后ROSC患者神经功能预后不良的AUC为0.857(95%CI 0.809~0.903,P<0.001),在测试集上的AUC为0.834 (95%CI 0.761~0.906,P<0.001)。结论 基于XGBoost和RF这2种机器学习方法构建的决策树模型能够更准确地评估CA患者ROSC后神经功能的不良预后,且评价指标可能简化为NSE、ROSC时间及ONSD变化率。 展开更多
关键词 心脏骤停 自主循环恢复 神经功能 预测模型 随机森林 极端梯度提升
暂未订购
基于耳石微结构的渤海带鱼早期生长与环境的关系分析 被引量:3
14
作者 时政通 陈琪 +4 位作者 李建超 刘阳 孙润隆 席晓宇 孙鹏 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第6期65-73,共9页
在长期气候变化和捕捞压力下渤海带鱼(Trichiurus japonicus)仍保持较高产量,为探究这一现象是否与渤海带鱼早期生长有关,本研究通过对渤海带鱼耳石微结构分析,追溯其产卵时间,使用梯度森林模型以及广义加性模型分析渤海带鱼早期生长与... 在长期气候变化和捕捞压力下渤海带鱼(Trichiurus japonicus)仍保持较高产量,为探究这一现象是否与渤海带鱼早期生长有关,本研究通过对渤海带鱼耳石微结构分析,追溯其产卵时间,使用梯度森林模型以及广义加性模型分析渤海带鱼早期生长与环境因子之间的关系。研究表明,渤海带鱼产卵高峰期为5月。海底温度(SBT)、混合层深度(MLD)和海表盐度(SSS)是影响带鱼早期生长的重要环境因子。其中,带鱼早期生长速度随SBT的升高而持续增加,且在10~12℃范围内生长速度最快。同时,随着MLD的增加,带鱼早期生长速度呈减缓趋势。以上结果表明,温度的升高以及充足的饵料供给可以促进带鱼的早期生长和种群的补充。 展开更多
关键词 带鱼 耳石微结构 产卵时间 梯度森林模型 广义加性模型 环境因子
在线阅读 下载PDF
基于GFM和GAMM模型分析对虾白斑综合征(WSSV)对黄海和东海北部水域虾类生物量的影响 被引量:1
15
作者 徐婷婷 滕广亮 +4 位作者 李英瑕 吴强 单秀娟 张庆利 金显仕 《渔业科学进展》 CSCD 北大核心 2022年第1期46-55,共10页
虾类是海洋生态系统功能群的重要组成部分,其生物量变化受到多重因素的影响。本研究在开展黄海和东海北部水域虾类白斑综合征病毒(white spot syndrome virus,WSSV)流行病学调查的基础上,利用梯度随机森林模型(gradient random forest m... 虾类是海洋生态系统功能群的重要组成部分,其生物量变化受到多重因素的影响。本研究在开展黄海和东海北部水域虾类白斑综合征病毒(white spot syndrome virus,WSSV)流行病学调查的基础上,利用梯度随机森林模型(gradient random forest model,GFM)和广义加性混合模型(generalized additive mixed models,GAMM),分析了2016—2018年间黄海和东海北部水域WSSV流行对虾类生物量的影响。分子检测结果显示,调查所获取的26种虾类中,11种被检测为WSSV阳性;2016、2017和2018年WSSV阳性采样站点的比率分别为48.40%、38.75%和21.74%,虾类样品中WSSV阳性检出比率分别为16.86%、9.60%和4.80%。GFM模型分析显示,解释变量“阳性样品数的对数(ln_posi)”对响应变量“虾类生物量的对数(ln_Abu)”的重要性最高。GAMM分析中,根据赤池信息准则(Akaike information criterion,AIC)最小原则筛选出的最优模型为:ln_Abu~WSSV阳性率(P_rate)+ln_posi+经度(Long),该模型中ln_posi和P_rate是影响虾类生物量的极显著相关因子,ln_Abu随着P_rate的升高而降低。研究表明,WSSV在黄海和东海北部水域虾类中流行,推测对该海域的虾类生物量存在影响。 展开更多
关键词 对虾白斑综合征病毒 黄海和东海北部 虾类 GFM模型 GAMM模型
在线阅读 下载PDF
基于RFE-RF-XGBoost的坝体位移预测研究 被引量:7
16
作者 王昕宇 杨鹏 戴健非 《东北师大学报(自然科学版)》 CAS 北大核心 2021年第2期60-66,共7页
为了加强尾矿库的安全稳定管理,提高溃坝预测预警水平,以坝体位移为研究对象,安全监测数据为研究基础,提出一种基于特征递归消除与随机森林和极限梯度提升的尾矿坝坝体位移预测模型,并与XGBoost、LSTM神经网络、BP神经网络、SVR等预测... 为了加强尾矿库的安全稳定管理,提高溃坝预测预警水平,以坝体位移为研究对象,安全监测数据为研究基础,提出一种基于特征递归消除与随机森林和极限梯度提升的尾矿坝坝体位移预测模型,并与XGBoost、LSTM神经网络、BP神经网络、SVR等预测模型对比,以验证其预测效果.结果表明:所提出模型平均相对误差低于XGBoost模型3.93%,并考虑了外部因素对坝体形变的影响.该结果对于矿山施工决策、安全管理、环境保护,减少溃坝事故具有一定的参考意义. 展开更多
关键词 尾矿库 坝体位移 随机森林 极限梯度提升 预测模型
在线阅读 下载PDF
基于多中心队列数据的机器学习预测重症感染患儿死亡风险和筛选临床特征的研究 被引量:3
17
作者 朱雪梅 陈申成 +4 位作者 章莹莹 陆国平 叶琪 阮彤 郑英杰 《中国循证儿科杂志》 CSCD 北大核心 2024年第1期31-35,共5页
背景科学、有效地预测重症感染患儿死亡关联因素对降低儿童病死率意义重大。既往重症患儿的病情与死亡关系多采用评分预测(如PCIS等),准确度欠佳。目的通过机器学习联合特征筛选的方法,挖掘对重症感染患儿死亡风险具有早期预警作用的敏... 背景科学、有效地预测重症感染患儿死亡关联因素对降低儿童病死率意义重大。既往重症患儿的病情与死亡关系多采用评分预测(如PCIS等),准确度欠佳。目的通过机器学习联合特征筛选的方法,挖掘对重症感染患儿死亡风险具有早期预警作用的敏感指标。设计队列研究。方法基于全国20个省级行政区域的54家PICU的儿童多中心感染性疾病协作网数据库,纳入年龄>28天至18岁、确诊感染和至少有1个器官发生功能障碍的患儿,统计122项临床特征信息,以出PICU时死亡/恶化或治愈/好转为结局,通过机器学习构建逻辑回归模型(LR)、随机森林模型(RF)、极端梯度提升树(XGB)和反向传播神经网络(BP),筛选重要的临床特征建立重症感染患儿死亡风险预测模型。主要结局指标模型接收者操作特征曲线下面积(AUROC)和模型筛选临床特征性能的优劣。结果2022年4月1日至2023年12月31日协作网数据库中入PICU时确诊重症感染且入PICU时、入PICU 24 h时和出PICU时临床特征记录均完整的(病例1738例,经过数据预处理包括异常值处理、缺失值填充、强制值区间范围检验、归一化处理)1738条信息进入机器学习构建模型。存活或好转患儿1396例,死亡或恶化患儿342例(19.6%)。队列数据按4∶1分为训练集(1390条)和验证集(348条),训练集中存活或好转1116条,死亡或恶化274条;验证集中存活或好转280条,死亡或恶化68条。在训练集中,共输入模型122个临床特征,经过机器模型学习以及特征筛选后,在50轮的5折分层交叉验证下,验证集LR、RF和XGB的AUROC为0.74~0.78。LR、RF和XGB选择重要性大于均值的临床特征构建最优临床特征,尚无比较好的衡量BP特征重要性的方法,LR模型较RF和XGB构建的最优临床特征较为接近临床预期。结论机器学习预测儿童重症感染性疾病死亡/恶化结局表现一般,预测模型筛选的临床特征与临床预期尚有距离。 展开更多
关键词 机器学习 儿童重症监护室 感染 随机森林模型 极端梯度提升树
暂未订购
基于病害高发期气象因子的三七病害发生率预测 被引量:4
18
作者 熊凯 杨启良 +3 位作者 杨春曦 刘小刚 韩焕豪 周平 《农业工程学报》 EI CAS CSCD 北大核心 2020年第24期170-176,共7页
准确预报病害发生率是提前应对三七病害、提高产量和品质的重要基础。该研究利用2018-2019年云南红河州三七种植基地内田间气象数据和病害发生率资料,采用主效应分析(Principal Components Analysis, PCA)来避免多元共线性的发生。以201... 准确预报病害发生率是提前应对三七病害、提高产量和品质的重要基础。该研究利用2018-2019年云南红河州三七种植基地内田间气象数据和病害发生率资料,采用主效应分析(Principal Components Analysis, PCA)来避免多元共线性的发生。以2018年和2019年的5-9月气象数据集作为训练集与验证集,以随机森林(Random Forest, RF)算法作为基础学习机构建初步预测模型,最后通过梯度下降(GradientDescent,GD)算法进行优化。结果表明,土壤温度与棚内湿度均与病害发生率呈正相关,其皮尔逊相关系数在0.25~0.75之间,棚内土壤热通量和三七冠层上方土壤热通量均与病害发生率呈负相关,其皮尔逊相关系数在-0.75^-0.25之间;通过随机森林获得的模型的均方根误差为0.23;通过梯度下降优化,代价函数收敛时值为241.003,并获得各个气象因子对三七病害高发期的病害发生率影响的权重,其中土壤温度正相关程度最大,权重为21.686,三七冠层上方的土壤热通量负相关程度最大,权重为-13.834。该研究结果在通过田间气象因子预测三七病害高发期的病害发生率上具备可靠的预测能力,可为降低三七病害的设施环境调控和智能化管理提供理论依据和技术支持。 展开更多
关键词 病害 模型 中药材 随机森林 梯度下降 三七 气象因子
在线阅读 下载PDF
武夷山不同海拔梯度毛竹林土壤有机碳特征及影响因素 被引量:23
19
作者 张厚喜 林丛 +4 位作者 程浩 金昌善 徐自坤 魏志超 马祥庆 《土壤》 CAS CSCD 北大核心 2019年第4期821-828,共8页
以武夷山自然保护区的毛竹林土壤(海拔范围为250~1 500 m)为研究对象,选取5个海拔梯度的15块样地,分析了毛竹林土壤有机碳沿海拔梯度的分布特征,探讨了土壤有机碳含量与地形因子、土壤性质的相关关系,并构建了土壤有机碳的回归模型。结... 以武夷山自然保护区的毛竹林土壤(海拔范围为250~1 500 m)为研究对象,选取5个海拔梯度的15块样地,分析了毛竹林土壤有机碳沿海拔梯度的分布特征,探讨了土壤有机碳含量与地形因子、土壤性质的相关关系,并构建了土壤有机碳的回归模型。结果表明:①武夷山毛竹林土壤有机碳含量变化范围为13.29~70.68 g/kg,且海拔>500m土壤有机碳的分布具有明显的表聚现象;②同一海拔高度内,毛竹林土壤有机碳含量呈现随土层深度的增加而逐渐降低的趋势,且其降幅也随之变小;③同一土层深度的土壤有机碳含量大体呈现随海拔的升高而增加的趋势,而其增幅则随之变小;④不同土层土壤有机碳含量与海拔均呈显著或极显著正相关、与容重均呈极显著负相关,而仅表层(0~10 cm)土壤有机碳含量与坡度呈显著负相关;⑤土壤有机碳多元线性回归模型的拟合优度高于一元线性回归模型,不同因子组合对不同土层有机碳含量变异的解释量介于59%~83%。 展开更多
关键词 武夷山自然保护区 毛竹林 土壤有机碳 海拔梯度 多元线性回归模型
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部