期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
Mapping landslide susceptibility at the Three Gorges Reservoir, China, using gradient boosting decision tree,random forest and information value models 被引量:14
1
作者 CHEN Tao ZHU Li +3 位作者 NIU Rui-qing TRINDER C John PENG Ling LEI Tao 《Journal of Mountain Science》 SCIE CSCD 2020年第3期670-685,共16页
This work was to generate landslide susceptibility maps for the Three Gorges Reservoir(TGR) area, China by using different machine learning models. Three advanced machine learning methods, namely, gradient boosting de... This work was to generate landslide susceptibility maps for the Three Gorges Reservoir(TGR) area, China by using different machine learning models. Three advanced machine learning methods, namely, gradient boosting decision tree(GBDT), random forest(RF) and information value(InV) models, were used, and the performances were assessed and compared. In total, 202 landslides were mapped by using a series of field surveys, aerial photographs, and reviews of historical and bibliographical data. Nine causative factors were then considered in landslide susceptibility map generation by using the GBDT, RF and InV models. All of the maps of the causative factors were resampled to a resolution of 28.5 m. Of the 486289 pixels in the area,28526 pixels were landslide pixels, and 457763 pixels were non-landslide pixels. Finally, landslide susceptibility maps were generated by using the three machine learning models, and their performances were assessed through receiver operating characteristic(ROC) curves, the sensitivity, specificity,overall accuracy(OA), and kappa coefficient(KAPPA). The results showed that the GBDT, RF and In V models in overall produced reasonable accurate landslide susceptibility maps. Among these three methods, the GBDT method outperforms the other two machine learning methods, which can provide strong technical support for producing landslide susceptibility maps in TGR. 展开更多
关键词 MAPPING LANDSLIDE SUSCEPTIBILITY gradient BOOSTING DECISION tree random forest Information value model Three Gorges Reservoir
原文传递
Linear and Nonlinear Trading Models with Gradient Boosted Random Forests and Application to Singapore Stock Market
2
作者 Qin Qin Qing-Guo Wang +1 位作者 Jin Li Shuzhi Sam Ge 《Journal of Intelligent Learning Systems and Applications》 2013年第1期1-10,共10页
This paper presents new trading models for the stock market and test whether they are able to consistently generate excess returns from the Singapore Exchange (SGX). Instead of conventional ways of modeling stock pric... This paper presents new trading models for the stock market and test whether they are able to consistently generate excess returns from the Singapore Exchange (SGX). Instead of conventional ways of modeling stock prices, we construct models which relate the market indicators to a trading decision directly. Furthermore, unlike a reversal trading system or a binary system of buy and sell, we allow three modes of trades, namely, buy, sell or stand by, and the stand-by case is important as it caters to the market conditions where a model does not produce a strong signal of buy or sell. Linear trading models are firstly developed with the scoring technique which weights higher on successful indicators, as well as with the Least Squares technique which tries to match the past perfect trades with its weights. The linear models are then made adaptive by using the forgetting factor to address market changes. Because stock markets could be highly nonlinear sometimes, the Random Forest is adopted as a nonlinear trading model, and improved with Gradient Boosting to form a new technique—Gradient Boosted Random Forest. All the models are trained and evaluated on nine stocks and one index, and statistical tests such as randomness, linear and nonlinear correlations are conducted on the data to check the statistical significance of the inputs and their relation with the output before a model is trained. Our empirical results show that the proposed trading methods are able to generate excess returns compared with the buy-and-hold strategy. 展开更多
关键词 Stock modeling SCORING TECHNIQUE Least Square TECHNIQUE random forest gradient Boosted random forest
暂未订购
Machine learning-based models for prediction of in-hospital mortality in patients with dengue shock syndrome
3
作者 Luan Thanh Vo Thien Vu +2 位作者 Thach Ngoc Pham Tung Huu Trinh Thanh Tat Nguyen 《World Journal of Methodology》 2025年第3期89-99,共11页
BACKGROUND Severe dengue children with critical complications have been attributed to high mortality rates,varying from approximately 1%to over 20%.To date,there is a lack of data on machine-learning-based algorithms ... BACKGROUND Severe dengue children with critical complications have been attributed to high mortality rates,varying from approximately 1%to over 20%.To date,there is a lack of data on machine-learning-based algorithms for predicting the risk of inhospital mortality in children with dengue shock syndrome(DSS).AIM To develop machine-learning models to estimate the risk of death in hospitalized children with DSS.METHODS This single-center retrospective study was conducted at tertiary Children’s Hospital No.2 in Viet Nam,between 2013 and 2022.The primary outcome was the in-hospital mortality rate in children with DSS admitted to the pediatric intensive care unit(PICU).Nine significant features were predetermined for further analysis using machine learning models.An oversampling method was used to enhance the model performance.Supervised models,including logistic regression,Naïve Bayes,Random Forest(RF),K-nearest neighbors,Decision Tree and Extreme Gradient Boosting(XGBoost),were employed to develop predictive models.The Shapley Additive Explanation was used to determine the degree of contribution of the features.RESULTS In total,1278 PICU-admitted children with complete data were included in the analysis.The median patient age was 8.1 years(interquartile range:5.4-10.7).Thirty-nine patients(3%)died.The RF and XGboost models demonstrated the highest performance.The Shapley Addictive Explanations model revealed that the most important predictive features included younger age,female patients,presence of underlying diseases,severe transaminitis,severe bleeding,low platelet counts requiring platelet transfusion,elevated levels of international normalized ratio,blood lactate and serum creatinine,large volume of resuscitation fluid and a high vasoactive inotropic score(>30).CONCLUSION We developed robust machine learning-based models to estimate the risk of death in hospitalized children with DSS.The study findings are applicable to the design of management schemes to enhance survival outcomes of patients with DSS. 展开更多
关键词 Dengue shock syndrome Dengue mortality Machine learning Supervised models Logistic regression random forest K-nearest neighbors Support vector machine Extreme gradient Boost Shapley addictive explanations
暂未订购
多中心机器学习构建预测潜在器官捐献者的模型与决策曲线验证研究
4
作者 王旭 李文秀 +5 位作者 王凤华 吴淑莉 贾栋 葛鑫 单志华 李峒作 《器官移植》 北大核心 2026年第1期106-115,共10页
目的评估在多中心环境下构建的不同机器学习模型对潜在器官捐献者的预测价值并验证其临床应用可行性。方法研究纳入国内5家三级甲等医院在2020年1月至2023年12月收治的2000例符合潜在器官捐献评估标准的住院患者,随机分为训练集和内部... 目的评估在多中心环境下构建的不同机器学习模型对潜在器官捐献者的预测价值并验证其临床应用可行性。方法研究纳入国内5家三级甲等医院在2020年1月至2023年12月收治的2000例符合潜在器官捐献评估标准的住院患者,随机分为训练集和内部验证集(7∶3),另纳入2024年1月至2025年4月在哈尔滨医科大学附属第一医院收治的300例同类患者作为外部验证集。比较3种模型的曲线下面积(AUC)、灵敏度、特异度、准确率、F1-score,并对潜在器官捐献者判定流程一致性进行检验。采用多因素logistic回归分析潜在器官捐献者的预测因素,利用决策曲线分析(DCA)验证各模型的资源效益,评估阈值区间与干预平衡点。结果各中心除年龄外其他基本特征差异均无统计学意义(均为P>0.05),各中心研究者潜在器官捐献者判定流程间一致性良好[均为95%可信区间(CI)下限>0]。内部验证集中,XGBoost模型的预测性能最佳(AUC=0.92,95%CI0.89~0.94)且校准最佳(P=0.441,Brier分数0.099);外部验证集中,XGBoost模型的预测性能最佳(AUC=0.91,95%CI 0.88~0.94),均优于logistic回归与随机森林。多因素logistic回归显示使用机械通气影响最大(比值比=2.06,95%CI 1.54~2.76,P<0.001)。DCA显示XGBoost模型在0.2~0.6阈值区间净获益最高,“全部干预”策略仅在极低阈值略占优势,推荐阈值区间兼顾≥50%PPV与≤50例/100例高危患者转介量,可平衡干预成本与临床受益。结论多中心环境下建立的XGBoost模型在预测潜在器官捐献者方面准确率与校准度均较理想,结合DCA可有效指导临床干预时机与资源分配,为脑死亡后器官捐献评估与管理提供新思路。 展开更多
关键词 多中心机器学习 潜在器官捐献者 预测模型 决策曲线分析 极端梯度提升树 器官捐献评估 LOGISTIC回归模型 随机森林模型
暂未订购
基于6种机器学习模型的ICU患者多重耐药菌感染预测模型构建与评价
5
作者 王珂璇 金晓灵 茅一萍 《中华医院感染学杂志》 北大核心 2026年第3期422-426,共5页
目的分析重症监护室患者感染多重耐药菌的危险因素,通过6种机器学习算法构建患者感染多重耐药菌的预测模型,通过评价模型相关指标选出最佳模型,为临床工作者早期识别高危患者,及时采取相应的预防措施提供参考。方法纳入2019年6月-2023年... 目的分析重症监护室患者感染多重耐药菌的危险因素,通过6种机器学习算法构建患者感染多重耐药菌的预测模型,通过评价模型相关指标选出最佳模型,为临床工作者早期识别高危患者,及时采取相应的预防措施提供参考。方法纳入2019年6月-2023年6月入住徐州医科大学附属医院重症监护室患者946例(多重耐药菌感染者473例,非感染者473例)。采用二元logistic回归分析,将筛选的危险因素作为构建预测模型的特征变量进行模型构建,分别构建并评价逻辑回归模型、人工神经网络模型、决策树模型、随机森林模型、支持向量机模型和极限梯度增强模型。结果从外院或急诊入院(OR=2.635)、入住重症监护室时长≥7 d(OR=1.291)、手术(OR=3.089)、慢性肺部疾病(OR=3.664)、外周静脉置管(OR=2.111)、留置腹腔引流管(OR=3.382)、抗菌药物使用种类≥3种(OR=1.001)、抗菌药物使用时长≥1周(OR=2.323)是重症监护室患者感染多重耐药菌的危险因素(P<0.05)。通过机器学习算法构建的重症监护室患者感染多重耐药菌预测模型中,逻辑回归模型受试者工作特征曲线下面积、灵敏度、特异度、阳性预测值、阴性预测值、F1值均优于其他模型,为最优模型。结论临床应重视患者易感染多重耐药菌的危险因素,尽早给予针对性干预,降低重症监护室患者感染多重耐药菌的风险。 展开更多
关键词 机器学习 重症监护室 多重耐药菌 预测模型 逻辑回归模型 人工神经网络模型 决策树模型 随机森林模型 支持向量机模型 极限梯度增强模型
原文传递
基于机器学习的肠球菌血流感染预后不良预测模型的构建与评估
6
作者 韩亚飞 汪静 +3 位作者 张添添 陈莉 张浩 王强 《中华医院感染学杂志》 北大核心 2026年第5期790-795,共6页
目的构建基于机器学习肠球菌血流感染患者发生预后不良的多种预测模型,并评估其预测效能。方法回顾性分析2021年1月1日-2024年12月31日南京医科大学附属江宁医院收治的128例肠球菌血流感染患者的临床资料,采用Lasso回归和多因素logisti... 目的构建基于机器学习肠球菌血流感染患者发生预后不良的多种预测模型,并评估其预测效能。方法回顾性分析2021年1月1日-2024年12月31日南京医科大学附属江宁医院收治的128例肠球菌血流感染患者的临床资料,采用Lasso回归和多因素logistic回归筛选与其发生有关联的显著变量,并将其纳入机器学习模型。分别采用逻辑回归、决策树、随机森林、极限梯度提升、轻量级梯度提升机、支持向量机和人工神经网络7种机器学习方法构建预测模型,比较模型的精确率、准确率、灵敏度和F1分数等以评估不同模型的预测效能。结果逻辑回归、决策树、随机森林、极限梯度提升、轻量级梯度提升机、支持向量机和人工神经网络在测试集中的准确率分别为83.33、84.44、87.78、86.67、82.22、86.67和86.67;精确率分别为88.24、78.72、85.71、83.72、77.78、83.72和83.72;F1分数分别为0.800、0.841、0.867、0.857、0.814、0.857和0.857;AUC值分别为0.922、0.922、0.952、0.933、0.878、0.916和0.942。其中随机森林模型预测性提示,低蛋白血症是最具影响力的因素。结论成功构建出预测肠球菌血流感染患者发生预后不良的模型,其中随机森林模型预测效能最佳,可为该类患者临床护理工作提供一个早期预测和防治预后不良发生的有效工具。 展开更多
关键词 肠球菌 血流感染 机器学习 逻辑回归 决策树 随机森林 极限梯度提升 轻量级梯度提升机 支持向量机 人工神经网络 预后不良 预测模型
原文传递
基于高光谱及机器学习的植被等效水厚度研究
7
作者 邱凌 周涛 +2 位作者 宋词 杨锐锋 唐晓鹿 《铁路节能环保与安全卫生》 2026年第1期1-9,共9页
植被等效水厚度(EWT)是表征植被生态生理性状的关键指标,其从叶片尺度向生态尺度进行空间外推的不确定性目前尚未明确。研究以成都市都江堰丘陵地带为研究对象,基于无人机高光谱数据的光谱反射率特征,利用RF与XGBoost 2种机器学习算法,... 植被等效水厚度(EWT)是表征植被生态生理性状的关键指标,其从叶片尺度向生态尺度进行空间外推的不确定性目前尚未明确。研究以成都市都江堰丘陵地带为研究对象,基于无人机高光谱数据的光谱反射率特征,利用RF与XGBoost 2种机器学习算法,系统揭示植被EWT在0.5 m、1 m、2 m共3种空间分辨率下的空间异质性及其驱动成因。结果显示:野外观测EWT平均水平为0.014 g/cm^(2),高光谱的504 nm、533 nm、680 nm、770 nm和904 nm为EWT反演的敏感波段;随着空间分辨率降低,由敏感波段改进的特征指数对各模型的贡献逐渐增大;在2 m空间分辨率下,基于REP_1指数与Cor指数构建的RF与XGBoost模型估算效率最高,且模型效率随输入变量空间分辨率降低呈上升趋势;研究区内植被EWT平均值为(0.013±0.003)g/cm^(2)(取值范围为0.006~0.023 g/cm^(2)),其高值区域主要分布于人为扰动显著的经济果园及居住点周边。说明空间分辨率变化对模型捕获植被EWT时空分布模式的能力影响显著;通过调整植被水分敏感特征参数的空间分辨率,实现丘陵地区EWT的高精度模拟,可为植被水分参数的跨尺度遥感反演提供可行方案和参考。 展开更多
关键词 特征指数 随机森林 极端梯度迭代 模型精度 空间分辨率
在线阅读 下载PDF
基于堆叠模型分类的空压机健康状态评估研究
8
作者 葛淩志 王磊 王晓冉 《机电工程》 北大核心 2026年第1期194-206,共13页
对工业空压机的健康状态进行准确的评估是保障生产系统可靠性、稳定性,降低系统运行成本的重要因素。针对传统健康评估方法在复杂工况下诊断精度和鲁棒性方面的局限性,提出了一种基于堆叠(Stacking)多模型集成的空压机健康状态评估模型... 对工业空压机的健康状态进行准确的评估是保障生产系统可靠性、稳定性,降低系统运行成本的重要因素。针对传统健康评估方法在复杂工况下诊断精度和鲁棒性方面的局限性,提出了一种基于堆叠(Stacking)多模型集成的空压机健康状态评估模型。首先,构建了异构基模型组,集成了K近邻分类器(KNN)、轻量梯度提升机(LGBM)、随机森林(RF)、极致梯度提升(XGB)四类算法,基于历史数据搭建了初始架构;然后,实施了联合参数优化,通过网格搜索与交叉验证协同调参,提升了基模型预测性能;最后,设计了基于径向基核函数的支持向量分类器(RBF-SVC),依托工程数据进行了实验验证。研究结果表明:基于堆叠多模型集成的空压机健康状态评估模型在处理可变操作条件时表现出较强的鲁棒性,特别是在面对噪声数据时,该模型在不同信噪比条件下显示出一致的诊断准确性,其准确率仍能保持在80%以上;横向对比分析表明,基于堆叠多模型集成的空压机健康状态评估模型在诊断精度上优于单一基模型及传统的健康诊断方法,在训练集和测试集上分别达到了98%和95%的准确率。该框架通过基模型互补性提升健康评估精度与鲁棒性,为空压机预测性维护提供技术支撑,具有重要工程价值。 展开更多
关键词 空气压缩机 基模型 模型集成 K近邻分类器 轻量梯度提升机 随机森林 极致梯度提升 基于径向基核函数的支持向量分类器
在线阅读 下载PDF
基于GFM和GAMM模型分析对虾白斑综合征(WSSV)对黄海和东海北部水域虾类生物量的影响 被引量:1
9
作者 徐婷婷 滕广亮 +4 位作者 李英瑕 吴强 单秀娟 张庆利 金显仕 《渔业科学进展》 CSCD 北大核心 2022年第1期46-55,共10页
虾类是海洋生态系统功能群的重要组成部分,其生物量变化受到多重因素的影响。本研究在开展黄海和东海北部水域虾类白斑综合征病毒(white spot syndrome virus,WSSV)流行病学调查的基础上,利用梯度随机森林模型(gradient random forest m... 虾类是海洋生态系统功能群的重要组成部分,其生物量变化受到多重因素的影响。本研究在开展黄海和东海北部水域虾类白斑综合征病毒(white spot syndrome virus,WSSV)流行病学调查的基础上,利用梯度随机森林模型(gradient random forest model,GFM)和广义加性混合模型(generalized additive mixed models,GAMM),分析了2016—2018年间黄海和东海北部水域WSSV流行对虾类生物量的影响。分子检测结果显示,调查所获取的26种虾类中,11种被检测为WSSV阳性;2016、2017和2018年WSSV阳性采样站点的比率分别为48.40%、38.75%和21.74%,虾类样品中WSSV阳性检出比率分别为16.86%、9.60%和4.80%。GFM模型分析显示,解释变量“阳性样品数的对数(ln_posi)”对响应变量“虾类生物量的对数(ln_Abu)”的重要性最高。GAMM分析中,根据赤池信息准则(Akaike information criterion,AIC)最小原则筛选出的最优模型为:ln_Abu~WSSV阳性率(P_rate)+ln_posi+经度(Long),该模型中ln_posi和P_rate是影响虾类生物量的极显著相关因子,ln_Abu随着P_rate的升高而降低。研究表明,WSSV在黄海和东海北部水域虾类中流行,推测对该海域的虾类生物量存在影响。 展开更多
关键词 对虾白斑综合征病毒 黄海和东海北部 虾类 gfm模型 GAMM模型
在线阅读 下载PDF
Modelling the dead fuel moisture content in a grassland of Ergun City,China 被引量:1
10
作者 CHANG Chang CHANG Yu +1 位作者 GUO Meng HU Yuanman 《Journal of Arid Land》 SCIE CSCD 2023年第6期710-723,共14页
The dead fuel moisture content(DFMC)is the key driver leading to fire occurrence.Accurately estimating the DFMC could help identify locations facing fire risks,prioritise areas for fire monitoring,and facilitate timel... The dead fuel moisture content(DFMC)is the key driver leading to fire occurrence.Accurately estimating the DFMC could help identify locations facing fire risks,prioritise areas for fire monitoring,and facilitate timely deployment of fire-suppression resources.In this study,the DFMC and environmental variables,including air temperature,relative humidity,wind speed,solar radiation,rainfall,atmospheric pressure,soil temperature,and soil humidity,were simultaneously measured in a grassland of Ergun City,Inner Mongolia Autonomous Region of China in 2021.We chose three regression models,i.e.,random forest(RF)model,extreme gradient boosting(XGB)model,and boosted regression tree(BRT)model,to model the seasonal DFMC according to the data collected.To ensure accuracy,we added time-lag variables of 3 d to the models.The results showed that the RF model had the best fitting effect with an R2value of 0.847 and a prediction accuracy with a mean absolute error score of 4.764%among the three models.The accuracies of the models in spring and autumn were higher than those in the other two seasons.In addition,different seasons had different key influencing factors,and the degree of influence of these factors on the DFMC changed with time lags.Moreover,time-lag variables within 44 h clearly improved the fitting effect and prediction accuracy,indicating that environmental conditions within approximately 48 h greatly influence the DFMC.This study highlights the importance of considering 48 h time-lagged variables when predicting the DFMC of grassland fuels and mapping grassland fire risks based on the DFMC to help locate high-priority areas for grassland fire monitoring and prevention. 展开更多
关键词 dead fuel moisture content(DFMC) random forest(RF)model extreme gradient boosting(XGB)model boosted regression tree(BRT)model GRASSLAND Ergun City
在线阅读 下载PDF
Multi-Level, Multi-Scale Modeling and Predictive Mapping for Jaguars in the Brazilian Pantanal
11
作者 Eve Bohnett Dave Hulse +1 位作者 Bilal Ahmad Thomas Hoctor 《Open Journal of Ecology》 2020年第5期243-263,共21页
Multi-level multi-scale resource selection models using machine learning were compared and contrasted for generating predictive maps of jaguar habitat (Panthera onca) in the Brazilian Pantanal. Multiple spatial scales... Multi-level multi-scale resource selection models using machine learning were compared and contrasted for generating predictive maps of jaguar habitat (Panthera onca) in the Brazilian Pantanal. Multiple spatial scales and temporal movement levels were run within several analytical modeling frameworks for comparison. Included in the analysis were multi-scale raster grains (30 m, 90 m, 180 m, 360 m, 720 m, 1440 m) and GPS collaring temporal movement levels (point, path, and step). Various analytical methods were used for comparison of models that could accommodate data structural levels (group, individual, case-control). Models compared included conditional logistic regression, generalized additive modeling (GAM), and classification regression trees, such as random forests (RF) and gradient boosted regression tree (GBM). The goals of the study were to discuss the potential and limitations for machine learning methods using GPS collaring data to produce predictive habitat suitability mapping using the various scales and levels available. Results indicated that choosing the appropriate temporal level and raster scale improved model outputs. Overall, larger level analytical modeling frameworks and those that used multi-scale raster grains showed the best model evaluation with the inherent condition that they predict a broader scale and subset of data. The identification of the appropriate spatial scale, temporal scale and statistical model need careful consideration in predictive mapping efforts. 展开更多
关键词 Machine Learning Movement Ecology HABITAT SELECTION Resource SELECTION MULTIPLE Levels MULTIPLE Scales PREDICTIVE models gradient Boosting Method random forest
在线阅读 下载PDF
比较多种机器学习模型预测肺移植术后受者生存 被引量:1
12
作者 史灵芝 刘亚灵 +7 位作者 严浩吉 喻赠玮 侯森林 刘明昭 杨航 吴波 田东 陈静瑜 《器官移植》 北大核心 2025年第2期264-271,共8页
目的 比较不同机器学习算法构建的预后模型在预测肺移植(LTx)受者生存期方面的性能和表现。方法 回顾性收集483例行LTx手术的受者资料,所有受者按7∶3的比例分为训练集和验证集,将收集到的24个变量基于变量重要性(VIMP)进行筛选,利用随... 目的 比较不同机器学习算法构建的预后模型在预测肺移植(LTx)受者生存期方面的性能和表现。方法 回顾性收集483例行LTx手术的受者资料,所有受者按7∶3的比例分为训练集和验证集,将收集到的24个变量基于变量重要性(VIMP)进行筛选,利用随机生存森林(RSF)和极端梯度提升树(XGBoost)构建预后模型,使用综合曲线下面积(iAUC)和时间依赖曲线下面积(t AUC)进行模型性能评估。结果 训练集和验证集的各变量差异均无统计学意义。基于VIMP筛选排名前15的变量用于建模并确定重症监护室(ICU)住院时间为最重要的因素。与XGBoost模型相比,RSF模型在预测受者生存期方面表现出更好的性能(i AUC0.773比0.723)。在预测受者6个月生存期(tAUC6个月0.884比0.809,P=0.009)和1年生存期(tAUC1年0.896比0.825,P=0.013)方面,RSF模型也表现出更好的性能。基于两种算法的预测截断值,将LTx术后受者分为高风险组和低风险组,两种模型的生存分析结果均显示高风险组受者的生存率低于低风险组(P<0.001)。结论 与XGBoost相比,基于RSF算法开发的机器学习预后模型可以更好地预测LTx受者的生存期。 展开更多
关键词 肺移植 机器学习 预测模型 随机生存森林 极端梯度提升树 生存期 比例风险回归模型 重症监护室
暂未订购
基于机器学习的Budyko框架流域时变特征参数估计 被引量:1
13
作者 薛联青 陈雨欣 +1 位作者 刘远洪 杨明杰 《水资源保护》 北大核心 2025年第4期10-18,41,共10页
为分析黄河中游Budyko框架流域特征参数的时空变化,并捕捉不同因素对流域特征参数的影响,基于黄河中游8个子流域的径流、气象和人类活动数据,分区构建多元线性回归(MLR)、梯度提升(GB)和随机森林(RF)模型,对傅抱璞方程中的流域特征参数... 为分析黄河中游Budyko框架流域特征参数的时空变化,并捕捉不同因素对流域特征参数的影响,基于黄河中游8个子流域的径流、气象和人类活动数据,分区构建多元线性回归(MLR)、梯度提升(GB)和随机森林(RF)模型,对傅抱璞方程中的流域特征参数ω进行模拟。通过交叉验证选择表现最优的模型,识别对ω影响显著的主要控制因素,并进一步将最优模型纳入水热耦合平衡方程,构建时变Budyko框架,量化气候变化和下垫面变化对径流的贡献率。结果表明:3种模型中,RF模型在模拟ω时优于MLR和GB模型;1980—2019年各子流域ω值均呈增大趋势,ω主要受不透水面面积、人口和地区生产总值等人类活动因素的控制,在气候因素中潜在蒸散发是重要的控制因素;下垫面变化是黄河中游大多数子流域径流变化的主要驱动因素,然而气候变化对沁河子流域的影响略强于下垫面变化。 展开更多
关键词 Budyko框架 流域特征参数 多元线性回归模型 梯度提升模型 随机森林模型 黄河中游
在线阅读 下载PDF
基于机器学习算法模型的焊接接头疲劳寿命预测 被引量:3
14
作者 徐梦悦 齐红宇 +2 位作者 李少林 石多奇 杨晓光 《航空发动机》 北大核心 2025年第1期96-102,共7页
焊接接头具有非均匀的微观组织和梯度过渡的力学性能及随机分布的焊接缺陷等特征,相较于其他结构更容易产生疲劳断裂,特别是焊接接头的疲劳载荷下的强度和寿命问题已成为工程界和学术界的研究热点。为了研究焊接接头的疲劳行为,开展了... 焊接接头具有非均匀的微观组织和梯度过渡的力学性能及随机分布的焊接缺陷等特征,相较于其他结构更容易产生疲劳断裂,特别是焊接接头的疲劳载荷下的强度和寿命问题已成为工程界和学术界的研究热点。为了研究焊接接头的疲劳行为,开展了基于随机森林(RF)模型的焊接接头疲劳寿命预测模型的全新研究。通过采用RF和轻梯度提升机(LightGBM)2种不同的机器学习算法模型对焊接接头的疲劳数据集进行分析和预测,从中选择预测性能更优的机器学习模型;通过比较在不同几何形状下疲劳寿命的预测结果,评估几何形状对机器学习模型预测性能的影响;利用RF算法对输入条件进行重要度排序,分析焊接接头疲劳寿命的影响因素;通过计算模型在不同材料下的疲劳寿命结果验证机器学习模型的泛化能力。结果表明:机器学习模型对不同几何形状的焊接接头疲劳寿命的预测效果较好,且可用于预测在不同材料下的焊接接头疲劳寿命。研究结果对焊接结构的强度设计与焊接工艺参数优化等具有重要意义。 展开更多
关键词 机器学习 随机森林算法 轻梯度提升机算法 焊接接头 疲劳寿命 几何形状 预测模型
在线阅读 下载PDF
基于机器学习方法预测3D打印零件的性能
15
作者 洪学银 高尚 《中国塑料》 北大核心 2025年第7期72-79,共8页
采用拉丁超立方实验设计,研究了层高、壁厚、顶底厚、顶底线条方向、填充密度、填充线条方向、打印速度、挤出温度、床温、工作空间温度10种熔融沉积建模(FDM)工艺参数对丙烯腈-丁二烯-苯乙烯共聚物(ABS)零件拉伸性能的影响,对比了人工... 采用拉丁超立方实验设计,研究了层高、壁厚、顶底厚、顶底线条方向、填充密度、填充线条方向、打印速度、挤出温度、床温、工作空间温度10种熔融沉积建模(FDM)工艺参数对丙烯腈-丁二烯-苯乙烯共聚物(ABS)零件拉伸性能的影响,对比了人工神经元网络(ANN)、随机森林(RF)和梯度提升算法(GB)3种机器学习方法预测拉伸性能的准确性。结果表明,ANN预测拉伸强度和断裂伸长率的相关系数R仅为0.883 5和0.892 4,在训练和测试数据集上,预测的均方误差(MSE)在5~10和20~24之间;RF预测的R值为0.913 6和0.924 0,MSE在3~8和15~20之间;GB预测准确性最高,R值为0.975 9和0.981 2,MSE最低,在1~4和8~10之间。在10种工艺参数中,在采用RF模型时,拉伸性能的显著影响因素为填充密度、壁厚、填充线条方向和顶底厚,在采用GB模型时,拉伸性能的显著影响因素为填充密度、壁厚、层高和填充线条方向。填充密度是影响拉伸性能最显著的因素,对GB预测结果的影响显著性达到80%左右,远大于RF模型中的40%。 展开更多
关键词 熔融沉积建模 人工神经元网络 随机森林 gradient Boosting 拉伸性能
在线阅读 下载PDF
基于机器学习的长三角农业区PM_(2.5)中重金属浓度预测 被引量:1
16
作者 张鸿燕 靳浩 +3 位作者 莫迎平 张海鸥 潘超 樊建凌 《环境科学》 北大核心 2025年第8期5013-5022,共10页
PM_(2.5)中重金属对空气质量、人体健康和生态环境等均有重要影响,但当前对农业区域PM_(2.5)中重金属的研究与关注较少.搜集了长三角区域2000~2020年PM_(2.5)中重金属浓度观测数据,构建了基于机器学习的大气PM_(2.5)中重金属浓度预测模... PM_(2.5)中重金属对空气质量、人体健康和生态环境等均有重要影响,但当前对农业区域PM_(2.5)中重金属的研究与关注较少.搜集了长三角区域2000~2020年PM_(2.5)中重金属浓度观测数据,构建了基于机器学习的大气PM_(2.5)中重金属浓度预测模型,预测并分析了长三角农业区PM_(2.5)中Pb、Cu、As、Cd、Zn和Ti共6种重金属元素的区域污染特征.结果表明,随机森林(RF)、支持向量机(SVM)和梯度提升机(GBM)这3种机器学习模型单独预测PM_(2.5)中各重金属元素时均未表现出良好的预测效果(近一半模型R^(2)<0.66);将3种模型进行加权平均融合后均表现有较大改善(R^(2)均>0.66),对6种金属元素浓度均达到可定量预测的能力(RPD>1.4);对长三角农业区PM_(2.5)中重金属元素浓度的预测结果发现,6种重金属元素浓度平均值(ng·m^(-3))大小为:Zn>Pb>Cu/Ti>As>Cd,但各元素时空分布差异较大,2015~2017年Pb、Cd、As和Zn的浓度均逐年递减,而Cu和Ti的浓度则未出现明显时间变化.空间分布上,Pb、Cu和Ti这3种元素在长三角农业区北方大气PM_(2.5)中浓度较高,在南方则较低;As和Cd元素则在安徽北部和浙江西部山区的PM_(2.5)中浓度分布较高;而Zn元素在各农业区均有较高浓度的分布.研究结果可为预测区域大气颗粒物中重金属浓度提供一种有效方法,并为了解长三角农业区大气颗粒物污染特征及区域污染减排工作提供参考依据. 展开更多
关键词 大气PM_(2.5) 随机森林(RF) 支持向量机(SVM) 梯度提升机(GBM) 机器学习模型融合 区域重金属污染
原文传递
机载激光雷达数据与机器学习算法的森林蓄积量估测模型构建精度评价——基于KNN、XGBoost与RF模型反演算法 被引量:2
17
作者 潘自辉 肖正利 +5 位作者 黄光体 赵文纯 张流洋 刘晓阳 肖箫 林浩然 《湖北林业科技》 2025年第2期34-44,50,共12页
基于激光雷达系统获取数据,旨在探索建立一个适用于湖北省的混合树种蓄积量估测模型。研究区涵盖9个市州及15个县市区386个样地(小班),涉及3种森林类型(阔叶林、针叶林和针阔混交林),划分为5个植被区,分别为大别山桐柏山丘陵低山、鄂西... 基于激光雷达系统获取数据,旨在探索建立一个适用于湖北省的混合树种蓄积量估测模型。研究区涵盖9个市州及15个县市区386个样地(小班),涉及3种森林类型(阔叶林、针叶林和针阔混交林),划分为5个植被区,分别为大别山桐柏山丘陵低山、鄂西北山地丘陵、鄂东南低山丘陵、江汉平原湖泊和鄂西南山地;从点云数据中提取森林参数特征变量,结合实地调查数据,分别采用机器算法KNN、XGBoost和RF模型对森林蓄积量进行估测,采用决定系数评价模型估测精度,对估测结果进行比较分析。结果表明:(1)RF模型的估测值与实际值较为接近,精度高于KNN和XGBoost模型;(2)不同地貌区域的森林类型估测精度存在差异,表现为针叶林估测精度高于阔叶林;估测精度与林分郁闭度、林龄、起源等因子存在相关性,林分郁闭度较高时,估测精度较高;中龄、近熟林及过熟林估测精度较高,人工林的精度高于天然林;(3)蓄积量估测值精度与实测值的区间相关,实测值趋于一定低值与高值区间时,估测精度降低。通过激光雷达数据的反演结果与地面调查数据验证,反映了模型的准确度,促进林业调查与激光雷达融合运用,需进一步比较多种模型,并探索森林分布、林木结构特征、林分因子等之间影响估测精度的相关因素。 展开更多
关键词 激光雷达 森林蓄积量 模型反演 K-近邻算法 极端梯度提升 随机森林
在线阅读 下载PDF
数字化转型对碳排放强度影响研究——基于广东省的面板数据 被引量:1
18
作者 韩凤彩 邹俊锋 《对外经贸》 2025年第10期45-51,共7页
随着近年来全球气候变化问题的加剧,降低碳排放已成为各国实现可持续发展的重要议题。广东省作为中国经济发达地区之一,是降低碳排放重点地区。而数字化转型则是广东省降低碳排放强度的重要发展方向。为了研究数字化转型对碳排放强度的... 随着近年来全球气候变化问题的加剧,降低碳排放已成为各国实现可持续发展的重要议题。广东省作为中国经济发达地区之一,是降低碳排放重点地区。而数字化转型则是广东省降低碳排放强度的重要发展方向。为了研究数字化转型对碳排放强度的影响,分析2006年至2022年的广东省面板数据,采用梯度提升回归模型和随机森林模型,探讨数字化转型对碳排放强度的影响。研究结果表明,数字化转型显著降低了碳排放强度。此外,在探讨数字化转型对碳排放强度的影响同时还研究了经济发展水平、产业结构、环境规制和对外开放程度等控制变量对碳排放强度的影响,为广东省的绿色低碳发展提供了实证依据和政策建议。 展开更多
关键词 数字化转型 碳排放强度 广东省 梯度提升回归 随机森林
在线阅读 下载PDF
多机器学习模型下南京市PM_(2.5)预测分析
19
作者 鞠杨 《环境科学导刊》 2025年第2期46-52,共7页
针对南京市PM_(2.5)浓度预测问题,采用了五种不同的机器学习模型:多元线性回归、随机森林、K最邻近模型(KNN)、BP神经网络模型(BPNN)和极端梯度提升算法(XGBoost)。研究基于南京市2021年和2022年的空气质量及气象数据,通过数据预处理和... 针对南京市PM_(2.5)浓度预测问题,采用了五种不同的机器学习模型:多元线性回归、随机森林、K最邻近模型(KNN)、BP神经网络模型(BPNN)和极端梯度提升算法(XGBoost)。研究基于南京市2021年和2022年的空气质量及气象数据,通过数据预处理和特征缩放,对模型进行训练和测试。评估指标包括相关系数(R2)、均方差(RMSE)、平均绝对误差(MAE)和平均绝对百分比误差(MAPE)。研究结果表明,五种模型总体上预测性能良好,其中随机森林模型的预测精度最高,误差最小。不同季节的预测精度分析显示,多元线性回归和BP神经网络模型(BPNN)在春季和冬季的预测精度高于夏季和秋季;而随机森林、K最邻近模型(KNN)和极端梯度提升算内存占用最多,而K最邻近模型(KNN)模型的运行时间和内存占用最少。综合考虑预测精度和运行效率,随机森林模型在南京市PM_(2.5)浓度预测中表现最佳。 展开更多
关键词 气象因子 PM_(2.5)预测 机器学习 多元线性回归模型 随机森林模型 K最邻近模型(KNN) BP神经网络模型(BPNN) 极端梯度提升算法(XGBoost)
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部