期刊文献+
共找到103篇文章
< 1 2 6 >
每页显示 20 50 100
A Study on the Inter-Pretability of Network Attack Prediction Models Based on Light Gradient Boosting Machine(LGBM)and SHapley Additive exPlanations(SHAP)
1
作者 Shuqin Zhang Zihao Wang Xinyu Su 《Computers, Materials & Continua》 2025年第6期5781-5809,共29页
The methods of network attacks have become increasingly sophisticated,rendering traditional cybersecurity defense mechanisms insufficient to address novel and complex threats effectively.In recent years,artificial int... The methods of network attacks have become increasingly sophisticated,rendering traditional cybersecurity defense mechanisms insufficient to address novel and complex threats effectively.In recent years,artificial intelligence has achieved significant progress in the field of network security.However,many challenges and issues remain,particularly regarding the interpretability of deep learning and ensemble learning algorithms.To address the challenge of enhancing the interpretability of network attack prediction models,this paper proposes a method that combines Light Gradient Boosting Machine(LGBM)and SHapley Additive exPlanations(SHAP).LGBM is employed to model anomalous fluctuations in various network indicators,enabling the rapid and accurate identification and prediction of potential network attack types,thereby facilitating the implementation of timely defense measures,the model achieved an accuracy of 0.977,precision of 0.985,recall of 0.975,and an F1 score of 0.979,demonstrating better performance compared to other models in the domain of network attack prediction.SHAP is utilized to analyze the black-box decision-making process of the model,providing interpretability by quantifying the contribution of each feature to the prediction results and elucidating the relationships between features.The experimental results demonstrate that the network attack predictionmodel based on LGBM exhibits superior accuracy and outstanding predictive capabilities.Moreover,the SHAP-based interpretability analysis significantly improves the model’s transparency and interpretability. 展开更多
关键词 Artificial intelligence network attack prediction light gradient boosting machine(LGBM) shapley additive explanations(shap) INTERPRETABILITY
在线阅读 下载PDF
An improved permeability estimation model using integrated approach of hybrid machine learning technique and Shapley additive explanation
2
作者 Christopher N.Mkono Chuanbo Shen +1 位作者 Alvin K.Mulashani Patrice Nyangi 《Journal of Rock Mechanics and Geotechnical Engineering》 2025年第5期2928-2942,共15页
Accurate reservoir permeability determination is crucial in hydrocarbon exploration and production.Conventional methods relying on empirical correlations and assumptions often result in high costs,time consumption,ina... Accurate reservoir permeability determination is crucial in hydrocarbon exploration and production.Conventional methods relying on empirical correlations and assumptions often result in high costs,time consumption,inaccuracies,and uncertainties.This study introduces a novel hybrid machine learning approach to predict the permeability of the Wangkwar formation in the Gunya oilfield,Northwestern Uganda.The group method of data handling with differential evolution(GMDH-DE)algorithm was used to predict permeability due to its capability to manage complex,nonlinear relationships between variables,reduced computation time,and parameter optimization through evolutionary algorithms.Using 1953 samples from Gunya-1 and Gunya-2 wells for training and 1563 samples from Gunya-3 for testing,the GMDH-DE outperformed the group method of data handling(GMDH)and random forest(RF)in predicting permeability with higher accuracy and lower computation time.The GMDH-DE achieved an R^(2)of 0.9985,RMSE of 3.157,MAE of 2.366,and ME of 0.001 during training,and for testing,the ME,MAE,RMSE,and R^(2)were 1.3508,12.503,21.3898,and 0.9534,respectively.Additionally,the GMDH-DE demonstrated a 41%reduction in processing time compared to GMDH and RF.The model was also used to predict the permeability of the Mita Gamma well in the Mandawa basin,Tanzania,which lacks core data.Shapley additive explanations(SHAP)analysis identified thermal neutron porosity(TNPH),effective porosity(PHIE),and spectral gamma-ray(SGR)as the most critical parameters in permeability prediction.Therefore,the GMDH-DE model offers a novel,efficient,and accurate approach for fast permeability prediction,enhancing hydrocarbon exploration and production. 展开更多
关键词 PERMEABILITY HYDROCARBON Differential evolution shapley additive explanation(shap) Group method of data handling Well logs
在线阅读 下载PDF
Investigation of feature contribution to shield tunneling-induced settlement using Shapley additive explanations method 被引量:16
3
作者 K.K.Pabodha M.Kannangara Wanhuan Zhou +1 位作者 Zhi Ding Zhehao Hong 《Journal of Rock Mechanics and Geotechnical Engineering》 SCIE CSCD 2022年第4期1052-1063,共12页
Accurate prediction of shield tunneling-induced settlement is a complex problem that requires consideration of many influential parameters.Recent studies reveal that machine learning(ML)algorithms can predict the sett... Accurate prediction of shield tunneling-induced settlement is a complex problem that requires consideration of many influential parameters.Recent studies reveal that machine learning(ML)algorithms can predict the settlement caused by tunneling.However,well-performing ML models are usually less interpretable.Irrelevant input features decrease the performance and interpretability of an ML model.Nonetheless,feature selection,a critical step in the ML pipeline,is usually ignored in most studies that focused on predicting tunneling-induced settlement.This study applies four techniques,i.e.Pearson correlation method,sequential forward selection(SFS),sequential backward selection(SBS)and Boruta algorithm,to investigate the effect of feature selection on the model’s performance when predicting the tunneling-induced maximum surface settlement(S_(max)).The data set used in this study was compiled from two metro tunnel projects excavated in Hangzhou,China using earth pressure balance(EPB)shields and consists of 14 input features and a single output(i.e.S_(max)).The ML model that is trained on features selected from the Boruta algorithm demonstrates the best performance in both the training and testing phases.The relevant features chosen from the Boruta algorithm further indicate that tunneling-induced settlement is affected by parameters related to tunnel geometry,geological conditions and shield operation.The recently proposed Shapley additive explanations(SHAP)method explores how the input features contribute to the output of a complex ML model.It is observed that the larger settlements are induced during shield tunneling in silty clay.Moreover,the SHAP analysis reveals that the low magnitudes of face pressure at the top of the shield increase the model’s output。 展开更多
关键词 feature Selection Shield operational parameters Pearson correlation method Boruta algorithm shapley additive explanations(shap) analysis
在线阅读 下载PDF
基于可解释机器学习与SHAP值的精神分裂症患者攻击行为风险预测研究
4
作者 吴青青 沈藕英 陈琳霞 《医院管理论坛》 2026年第1期65-71,共7页
目的通过可解释的机器学习(ML)技术,提高对精神分裂症患者攻击行为风险的预测准确性。方法选取我院2022年1月—2024年6月间收治的529例精神分裂症患者作为研究对象。通过Boruta筛选患者攻击行为特征,以3∶2比例随机分为317例训练集和21... 目的通过可解释的机器学习(ML)技术,提高对精神分裂症患者攻击行为风险的预测准确性。方法选取我院2022年1月—2024年6月间收治的529例精神分裂症患者作为研究对象。通过Boruta筛选患者攻击行为特征,以3∶2比例随机分为317例训练集和212例测试集,8种ML模型10倍交叉验证。结果Boruta算法筛选出8个重要特征变量,包括CTQ-SF、BPRS、HDL、SES、MLR、PANSS阳性症状评分、PANSS一般精神病理评分和PLR。其中,XGBoost模型在ROC曲线中的AUC值最高。CTQ-SF、BPRS和HDL是预测攻击行为风险最重要的三个特征变量。结论XGBoost模型在预测攻击行为风险方面具有较高的准确性和临床价值,通过SHAP值解释,提升了模型的透明性和解释性,有助于临床医生更好地理解模型预测结果。 展开更多
关键词 精神分裂症 机器学习 Boruta算法 shapley加性解释 风险预测
暂未订购
基于CatBoost和SHAP的高级别自动驾驶车辆非预期停车冲突风险预测
5
作者 刘擎超 王瑞海 +2 位作者 蔡英凤 王海 陈龙 《汽车安全与节能学报》 北大核心 2025年第1期170-180,共11页
针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,... 针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,构建了冲突风险预测模型。结果表明,接管次数在城市中心、住宅区和郊区分别为161次、227次和164次,最高单路段接管次数分别为11次、11次和16次;模型预测精度达93%以上。SHAP分析显示,前后车辆间相对速度和相对位置对冲突风险的影响显著。研究结果对提升自动驾驶车辆的可靠性和安全性具有重要意义。 展开更多
关键词 冲突风险 交通排放 高级别自动驾驶 CatBoost算法 shap解释模型
在线阅读 下载PDF
TabPFN与SHAP融合的LF精炼Si元素收得率预测模型
6
作者 信自成 张江山 +1 位作者 张军国 刘青 《中国冶金》 北大核心 2025年第11期178-186,共9页
在钢包炉(LF)精炼过程中,准确预测合金元素收得率对于控制钢水成分、提高合金利用率及降低冶炼成本具有重要意义。近年来机器学习方法被广泛应用于冶金过程建模,但多数机器学习模型在实际应用中通常依赖复杂的超参数调优过程,且引入新... 在钢包炉(LF)精炼过程中,准确预测合金元素收得率对于控制钢水成分、提高合金利用率及降低冶炼成本具有重要意义。近年来机器学习方法被广泛应用于冶金过程建模,但多数机器学习模型在实际应用中通常依赖复杂的超参数调优过程,且引入新数据后往往需要重新调优超参数,建模效率有待提高。针对上述问题,首先,结合LF精炼实际生产数据,构建了基于表格先验数据拟合网络(TabPFN)的Si元素收得率预测模型;然后,利用多种模型评价指标,将TabPFN模型与已有研究的参考炉次法、多元线性回归模型以及多种机器学习模型进行了对比分析;最后,融合沙普利加性解释(SHAP)方法对TabPFN模型进行了全局与局部层面的解释分析。结果表明,TabPFN模型在无需大量超参数调优的情况下,在拟合优度(R^(2))、平均绝对误差(E_(MA))、均方根误差(E_(RMS))、命中率和模型推理时间等关键性能指标上均优于已有模型,各项指标分别达到了0.83、1.59、2.03、98.4%和0.430 s。同时,融合SHAP分析从全局层面揭示了各输入特征变量对Si元素收得率的影响大小,从局部层面量化了各输入特征变量对Si元素收得率预测值的影响程度,实现了LF精炼合金元素收得率的高效、高精度和可解释性预测,为钢铁工业在智能制造背景下的冶金过程建模提供了新的研究思路与技术路径。 展开更多
关键词 LF精炼 Si元素收得率 机器学习 表格先验数据拟合网络 沙普利加性解释
在线阅读 下载PDF
基于随机森林与SHAP算法的致密砂岩气暂堵效果的影响因素分析
7
作者 黄浩 车恒达 +3 位作者 孔祥伟 辛富斌 向九洲 吉俊杰 《科学技术与工程》 北大核心 2025年第26期11135-11143,共9页
为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂... 为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂堵效果量化模型和公式、暂堵效果算法模型验证,发现暂堵效果量化值与产气贡献率正相关,P=0.037,证明暂堵效果量化模型和公式的准确性高;又因暂堵效果算法模型中,训练集与测试集的MSE、MAE、R^(2)相差微小,证明该模型的泛化能力较强且准确性高。在暂堵效果算法模型的基础之上,开展暂堵效果的影响因素分析,结果表明:总段数、渗透率、暂堵球数量、簇间距和砂比这5个因素对于暂堵效果的影响占比最大。进一步分析单影响因素,发现随总段数增加,暂堵效果增加的规律只适用于直井,对水平井不适用;随渗透率增加,暂堵效果变差;暂堵球数量<50个、簇间距>20 m、砂比介于18%~20%,暂堵效果均可达到正向增长。研究结果可为苏里格等气田现场暂堵作业设计提供借鉴和参考。 展开更多
关键词 苏里格气田 致密砂岩气 暂堵效果 随机森林 shap(shapley additive explanations)值 模型解释
在线阅读 下载PDF
加速钙钛矿太阳能电池开发:基于机器学习驱动框架的SHAP分析
8
作者 梁锐权 刘谦 +4 位作者 胡春华 郑建楂 李阳 王亦文 麦耀华 《发光学报》 北大核心 2025年第11期2138-2149,共12页
钙钛矿太阳能电池(Perovskite solar cells,PSCs)以其高性能在新型太阳能电池技术中占据了重要地位。针对传统实验试错法在提升PSCs的光电转换效率(Power conversion efficiency,PCE)方面存在研究周期长和效率低下的不足,提出了一种基... 钙钛矿太阳能电池(Perovskite solar cells,PSCs)以其高性能在新型太阳能电池技术中占据了重要地位。针对传统实验试错法在提升PSCs的光电转换效率(Power conversion efficiency,PCE)方面存在研究周期长和效率低下的不足,提出了一种基于机器学习(Machine learning,ML)的PSCs制备工艺的智能优化方法。通过应用多种ML算法构建PCE预测模型,最终选择性能卓越的梯度提升(Gradient boosting,GB)模型进行夏普利加性解释(Shapley additive explanations,SHAP)可视化分析和实验验证。实验结果表明,基于模型输出指导的实验使PSCs的PCE达到了21.81%。本工作不仅有效解决了传统实验试错法的局限性,还攻克了ML在PSCs领域应用中预测精度低的难题,为快速开发高PCE的PSCs提供了新视角和科学依据,也为其他新型太阳能电池技术的开发提供了参考。 展开更多
关键词 钙钛矿太阳能电池 机器学习 夏普利加性解释(shap)分析 光电转换效率预测
在线阅读 下载PDF
Environmental interpretation of spatial heterogeneity in the trade-offs and synergies of land use functions:A study based on the XGBoost-SHAP model 被引量:1
9
作者 FENG Haoyuan ZHANG Xuebin +2 位作者 SHI Peiji SHI Jing WANG Ziyang 《Journal of Arid Land》 2025年第10期1378-1401,共24页
Accurately revealing the spatial heterogeneity in the trade-offs and synergies of land use functions(LUFs)and their driving factors is imperative for advancing sustainable land utilization and optimizing land use plan... Accurately revealing the spatial heterogeneity in the trade-offs and synergies of land use functions(LUFs)and their driving factors is imperative for advancing sustainable land utilization and optimizing land use planning.This is especially critical for ecologically vulnerable inland river basins in arid regions.However,existing methods struggle to effectively capture complex nonlinear interactions among environmental factors and their multifaceted relationships with trade-offs and synergies of LUFs,especially for the inland river basins in arid regions.Consequently,this study focused on the middle reaches of the Heihe River Basin(MHRB),an arid inland river basin in northwestern China.Using land use,socioeconomic,meteorological,and hydrological data from 2000 to 2020,we analyzed the spatiotemporal patterns of LUFs and their trade-off and synergy relationships from the perspective of production,living,ecological functions.Additionally,we employed an integrated Extreme Gradient Boosting(XGBoost)-SHapley Additive exPlanations(SHAP)framework to investigate the environmental factors influencing the spatial heterogeneity in the trade-offs and synergies of LUFs.Our findings reveal that from 2000 to 2020,the production,living,and ecological functions of land use within the MHRB exhibited an increasing trend,demonstrating a distinct spatial pattern of''high in the southwest and low in the northeast''.Significant spatial heterogeneity defined the trade-off and synergistic relationships,with trade-offs dominating human activity-intensive oasis areas,while synergies prevailed in other areas.During the study period,synergistic relationships between production and living functions and between production and ecological functions were relatively robust,whereas synergies in living-ecological functions remained weaker.Natural factors(digital elevation model(DEM),annual mean temperature,Normalized Difference Vegetation Index(NDVI),and annual precipitation)emerged as the primary factors driving the trade-offs and synergies of LUFs,followed by socioeconomic factors(population density,Gross Domestic Product(GDP),and land use intensity),while distance factors(distance to water bodies,distance to residential areas,and distance to roads)exerted minimal influence.Notably,the interactions among NDVI,annual mean temperature,DEM,and land use intensity exerted the most substantial impacts on the relationships among LUFs.This study provides novel perspectives and methodologies for unraveling the mechanisms underlying the spatial heterogeneity in the trade-offs and synergies of LUFs,offering scientific insights to inform regional land use planning and sustainable natural resource management in inland river basins in arid regions. 展开更多
关键词 production function living function ecological function trade-offs and synergies Extreme Gradient Boosting(XGBoost) shapley additive explanations(shap) Heihe River Basin
在线阅读 下载PDF
基于超参数优化与SHAP的广西桂林市滑坡灾害易发性评价
10
作者 刘子晗 苏会卫 曾铭玥 《水土保持通报》 北大核心 2025年第6期190-201,212,共13页
[目的]研究构建整合喀斯特地貌特征的滑坡易感性评价框架,揭示主导因素和相互作用机制,为喀斯特地貌区滑坡风险的精准控制提供理论依据。[方法]以广西桂林市为研究区,创新性融合岩溶特征,构建包含10个关键因子的地理空间数据库。采用逻... [目的]研究构建整合喀斯特地貌特征的滑坡易感性评价框架,揭示主导因素和相互作用机制,为喀斯特地貌区滑坡风险的精准控制提供理论依据。[方法]以广西桂林市为研究区,创新性融合岩溶特征,构建包含10个关键因子的地理空间数据库。采用逻辑回归(LR)、支持向量机(SVM)、随机森林(RF)、梯度提升机(GBM)和XGBoost5种机器学习模型进行滑坡易发性建模,利用网格搜索优化超参数,并通过准确率和AUC等指标评估模型性能。同时,引入SHAP算法量化因子贡献及交互效应。[结果]集成学习模型(RF,XGBoost)性能最佳,RF和XGBoost的准确率(0.85,0.84)和AUC(0.93,0.92)最高。所有模型呈现“面积递减—灾害密度激增”规律,RF在极高风险区的滑坡密度最高,为0.164例/km^(2)。SHAP分析显示,岩溶因子中的地下水位是多数模型中最具影响力的因子,与NDVI、距河流距离、土壤类型存在一定交互效应,集成模型在特征解释上的一致性较高。[结论]随机森林等集成模型结合SHAP框架,可显著提升喀斯特地貌区滑坡易发性制图的精度与可解释性,证实了地下水位与土壤类型的协同致灾机制。 展开更多
关键词 滑坡易发性 机器学习 shap可解释模型 喀斯特地貌
在线阅读 下载PDF
基于机器学习构建基层医疗机构早期识别肺结核预测模型并予SHAP解释
11
作者 李龙芬 施春晶 +9 位作者 田秀兰 李文明 罗云 张华杰 王戈 赵雁红 吴华超 陈秀 李翔 沈凌筠 《中国热带医学》 北大核心 2025年第12期1518-1526,共9页
目的利用机器学习充分挖掘血常规参数在早期诊断肺结核中的价值,以期为临床早期识别及筛选肺结核提供依据,探索基层医疗机构早期识别肺结核患者的新思路。方法采用回顾性分析方式,以2022年1月至2024年9月在昆明市第三人民医院(我院)和... 目的利用机器学习充分挖掘血常规参数在早期诊断肺结核中的价值,以期为临床早期识别及筛选肺结核提供依据,探索基层医疗机构早期识别肺结核患者的新思路。方法采用回顾性分析方式,以2022年1月至2024年9月在昆明市第三人民医院(我院)和沧源佤族自治县人民医院(外院)就诊的共1388例患者为研究对象,肺结核患者为实验组、健康体检者为对照组;其中,我院483例实验组和489例对照组患者作为训练集,外院226例实验组和190例对照组患者作为验证集,收集研究对象的临床资料。采用支持向量机-递归特征消除(support vector machine-recursive feature,SVM-REF)、最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)、Boruta算法、随机森林(random forest,RF)筛选变量并进行变量之间的多重共线性检验。基于logistic回归拟合预测模型,以数学方程和列线图呈现。采用临床决策曲线、临床影响曲线、校准曲线及外部验证评价模型。结果纳入研究对象1388例,训练集972例,验证集416例。纳入27个血常规参数及组合指标,筛选出6个可能指标分别为:红细胞平均血红蛋白浓度(mean corpuscular hemoglobin concentration,MCHC)、单核与淋巴细胞比(monocyte to lymphocyte ratio,MLR)、淋巴细胞(lymphocyte count,LYM)、红细胞分布宽度标准差(red cell distribution width-standard deviation,RDW-SD)、红细胞平均体积(mean corpuscular volume,MCV)、血小板(platelet count,PLT)。ROC曲线下面积(area under the curve,AUC)显示这6个指标的预测效能依次为:MCHC[AUC为0.878(95%CI:0.856~0.878)]、RDW-SD[AUC为0.797(95%CI:0.770~0.797)]、MLR[AUC为0.790(95%CI:0.762~0.791)]、LYM[AUC为0.777(95%CI:0.748~0.777)]、MCV[AUC为0.665(95%CI:0.631~0.665)]、PLT[AUC为0.606(95%CI:0.570~0.606)]。以AUC小于0.7的指标MCHC、MLR、RDW-SD、LYM作为预测因子进行多重共线性检验,Spearman相关系数显示各指标间相关系数绝对值均小于0.6,方差膨胀因子均小于2,即4个变量间不存在多重共线性。建立预测模型:Logit(P):Y=16.542+0.163×RDW-SD+4.609×MLR-0.069×MCHC-0.796×LYM,P=1/(1+e^(-Y))(Y:预测指数,P:预测概率)。在训练集中,模型的AUC为0.918(95%CI:0.9005~0.9350)、最佳截断值0.544、灵敏度78.5%、特异度90.2%、约登指数0.687;在验证集中,模型的AUC为0.931(95%CI:0.9063~0.9564)、最佳截断值0.459、灵敏度90.7%、特异度87.9%、约登指数0.786。在训练集中绘制校准曲线,拟合优度检验显示:χ^(2)=0.037,P=0.847。在验证集中绘制校准曲线,Hosmer-Lemeshow检验显示:χ^(2)=3.1154,P=0.078。训练集与验证集中临床决策曲线和影响曲线均显示,该模型能使患者获益。模型在验证集中的良好表现,显示模型稳定性良好。沙普利可加性解释(Shapley additive explanations,SHAP)展示模型决策过程,SHAP摘要图显示:在用于建模的4个指标中,对该模型贡献最大的是MCHC,贡献最小的是LYM。结论本研究基于血常规参数及组合指标建立的预测模型可以用于肺结核患者筛查及指导早期诊断,该模型有较高的预测价值、良好的区分度、临床适用性和稳定性,且适用广泛,不受医疗资源限制。 展开更多
关键词 机器学习 基层医疗机构 肺结核 预测模型 沙普利可加性解释
原文传递
Mapping and interpretability of aftershock hazards using hybrid machine learning algorithms
12
作者 Bo Liu Haijia Wen +4 位作者 Mingrui Di Junhao Huang Mingyong Liao Jingyuan Yu Yutao Xiang 《Journal of Rock Mechanics and Geotechnical Engineering》 2025年第8期4908-4932,共25页
This study addresses gaps in aftershock prediction research by proposing an interpretable hybrid machine learning model that leverages multi-source data.The model overcomes challenges related to the selection of influ... This study addresses gaps in aftershock prediction research by proposing an interpretable hybrid machine learning model that leverages multi-source data.The model overcomes challenges related to the selection of influencing factors,model types,prediction result visualization,and decision mechanism interpretability.It integrates mainshock factors,geological features,site characteristics,and terrain conditions using geospatial information system(GIS)technology.By employing the stacking algorithm to optimize and combine XGBoost and LightGBM models,the proposed model significantly improves the prediction performance.Visualization through aftershock hazard mapping offers a robust tool for aftershock warning.The Shapley additive explanations(SHAP)model is used to explain the decision-making process from both global and local perspectives.Results show that,compared to the optimized XGBoost-CMA_ES and LightGBM-CMA_ES hybrid models,the stacking model achieves area under the curve(AUC)increases of 7.71%and 5.72% on the test set,respectively,with a maximum prediction accuracy of 0.9344.The hazard zoning map identifies high-risk areas mainly around fault lines and near the epicenter.As hazard levels rise,the proportion and density of aftershocks in these areas increase.The SHAP model results highlight the distance to fault as the most critical factor.The study integrates local explanations with on-site investigations,effectively visualizing the contributions of different factors to aftershocks.This research provides new tools and methods for enhancing aftershock warning and response. 展开更多
关键词 Aftershock hazard mapping Hybrid model STACKING shapley additive explanations(shap) Visual analysis
在线阅读 下载PDF
基于空洞因果卷积的学生成绩预测及分析方法
13
作者 赖英旭 张亚薇 +1 位作者 庄俊玺 刘静 《北京工业大学学报》 北大核心 2026年第3期252-267,共16页
针对使用循环神经网络对学生长序列行为数据进行特征提取存在梯度消失或爆炸、长期依赖关系提取能力不足、深度学习模型缺乏可解释性等问题,提出一种面向长序列数据的空洞因果卷积(dilated causal convolution,DCC)成绩预测及分析方法... 针对使用循环神经网络对学生长序列行为数据进行特征提取存在梯度消失或爆炸、长期依赖关系提取能力不足、深度学习模型缺乏可解释性等问题,提出一种面向长序列数据的空洞因果卷积(dilated causal convolution,DCC)成绩预测及分析方法。首先,采用生成对抗网络(generative adversarial network,GAN)生成符合少数类学生原始行为数据分布规律的新样本,并将新样本加入学生数据集中以达到均衡数据集的目的;然后,提出一种基于DCC的成绩预测模型,DCC和门控循环单元(gated recurrent unit,GRU)相结合的结构提高了模型对长序列数据依赖关系的提取能力;最后,使用沙普利加性解释(Shapley additive explanations,SHAP)方法并结合三因素理论对影响学生成绩的因素进行重要性分析和解释。在公开数据集上的实验结果表明,在成绩预测任务中提出的方法与基线方法相比,加权F1分数提高了约6个百分点,并进一步验证了所提方法中关键模块的有效性和模型的泛化能力。此外,通过对比优秀学生和风险学生的学习特点发现,良好的学习习惯、课堂学习的主动性以及不同行为环境等因素会对学生成绩产生重要影响。 展开更多
关键词 学生成绩预测 空洞因果卷积(dilated causal convolution DCC) 不均衡数据 生成对抗网络(generative adversarial network GAN) 沙普利加性解释(shapley additive explanations shap)方法 成绩影响因素分析
在线阅读 下载PDF
基于“季节-源汇”下的山东大学主城区热环境驱动因素分析
14
作者 范强 相梦雪 +1 位作者 张兵 王丽芳 《生态环境学报》 北大核心 2026年第1期75-87,共13页
地表温度(LST)作为衡量城市热环境的关键指标,其时空分异特征与驱动机制已成为当前研究的前沿方向。传统线性模型在解析热环境系统的非线性动力学特征时存在局限性,而LightGBM模型结合Shapley加性解释(SHAP)的可解释性算法为揭示复杂驱... 地表温度(LST)作为衡量城市热环境的关键指标,其时空分异特征与驱动机制已成为当前研究的前沿方向。传统线性模型在解析热环境系统的非线性动力学特征时存在局限性,而LightGBM模型结合Shapley加性解释(SHAP)的可解释性算法为揭示复杂驱动机制提供了新方法。该研究针对现有研究中“源-汇”尺度景观效应量化与季节动态机制解析的不足,创新性地构建了以局地气候区为依托的“季节-源汇”二维分析框架。以山东大学主城区为研究区,融合多源遥感数据与地理空间数据,深入探究了城市空间形态、自然环境要素及人类活动对LST的耦合影响机制,量化分析了9类驱动因子在四季“源-汇”景观中对LST的贡献度,发现自然环境因素在城市热环境调控中占据主导地位,数字高程、归一化植被指数和改进归一化水体指数是关键调控因子。城市空间形态对LST的影响虽小于自然环境因素,但建筑容积率、天空开阔度和建筑覆盖率等因素仍具有显著作用。人类活动对LST的影响相对较小,但兴趣点数据和道路密度在局部区域仍存在一定的影响。这些发现为不同季节和源汇区域的差异化规划提供了战略性建议,为城市热环境管理提供了科学依据。应充分利用自然环境资源,合理规划建筑布局,以优化城市热环境,提升城市生态宜居性。 展开更多
关键词 城市热岛效应 LightGBM模型 shapley加性解释(shap) “源-汇”尺度 季节 局地气候区(LCZ)
在线阅读 下载PDF
木勺毛坯捆抓取柔性夹持器结构优化
15
作者 张加成 张森 +2 位作者 刘玉童 黄辉 赵辉 《森林工程》 北大核心 2026年第1期140-150,共11页
针对木勺模压工艺中人工浸水效率低、木勺毛坯易损的问题,设计一种面向木勺毛坯捆抓取的自适应柔性夹持器。结合有限元分析软件,开展优化试验方案的设计。提出基于超参数优化的贝叶斯优化算法(Bayesian optimization,BO)-随机森林(rando... 针对木勺模压工艺中人工浸水效率低、木勺毛坯易损的问题,设计一种面向木勺毛坯捆抓取的自适应柔性夹持器。结合有限元分析软件,开展优化试验方案的设计。提出基于超参数优化的贝叶斯优化算法(Bayesian optimization,BO)-随机森林(random forest,RF)方法(BO-RF),构建柔性夹持器应变能的回归预测模型,并运用可解释性机器学习方法(SHapley Additive exPlanations,SHAP)从全局和单个样本层面对模型进行可解释性分析。基于该预测模型,以最大上表面应变能和最小整体应变能为优化目标,应用遗传算法开展柔性夹持器的优化设计,并计算基于BO-RF模型的多目标帕累托(Pareto)前沿。仿真结果验证所提建模与优化方法的有效性和可行性。 展开更多
关键词 柔性夹持器 木勺毛坯捆 有限元分析 BO-RF随机森林 shap分析 遗传算法 多目标优化 应变能
在线阅读 下载PDF
基于机器学习的使用PD-1抑制剂后患者出现甲状腺障碍风险预测
16
作者 钟灿晖 赖信君 +2 位作者 陈文戈 林璐 詹陆川 《机电工程技术》 2026年第1期29-34,共6页
构建使用了PD-1抑制剂的肿瘤患者出现甲状腺功能障碍的风险预测模型,分析使用PD-1肿瘤抑制剂导致的甲状腺功能障碍的相关风险因素,设计监测预警系统。选取2020年—2023年广西医科大学附属肿瘤医院1225例使用PD-1抑制剂肿瘤患者的临床资... 构建使用了PD-1抑制剂的肿瘤患者出现甲状腺功能障碍的风险预测模型,分析使用PD-1肿瘤抑制剂导致的甲状腺功能障碍的相关风险因素,设计监测预警系统。选取2020年—2023年广西医科大学附属肿瘤医院1225例使用PD-1抑制剂肿瘤患者的临床资料,包括人口学特征、既往史、实验室检测等63个变量。本文选取相关性前10/20/30/40/50/60个变量的4种传统机器学习模型进行性能比较。通过F1分数、灵敏度、准确率、精确率、特异性曲线下面积(Area Under the Curve,AUC)评估以上预测模型的性能,并利用Shapley加性解释(Shapley Additive Explanation,SHAP)可视化解释本文的机器学习模型。与促甲状腺激素相关性排名前10的变量依次为:羟丁酸脱氢酶、乳酸脱氢酶、淋巴细胞绝对值、天门冬氨酸转移酶、钙离子、碱性磷酸酶、谷氨酰转肽酶、单核细胞绝对值、红细胞分布宽度SD、胆碱酯酶。建立了使用PD-1抑制剂的肿瘤患者出现甲状腺功能障碍的风险预测模型,并在全局解释和局部解释的层面上分别作出模型预测结果影响的解释。 展开更多
关键词 PD1 甲状腺功能障碍 机器学习 shapley加性解释(shap)
在线阅读 下载PDF
基于可解释机器学习驱动的岩溶隧道涌突水风险预测模型
17
作者 李傲 杨艳娜 +2 位作者 白伟 黄靖宇 周扬松 《安全与环境工程》 北大核心 2026年第1期211-221,共11页
机器学习模型在岩溶隧道涌突水风险预测中凭借其高精度、客观性和高计算效率,克服了知识驱动模型的一些局限性,但因其预测结果难以解释而发展受限。通过随机森林、支持向量机和k-最近邻算法结合贝叶斯优化算法分别构建岩溶隧道涌突水风... 机器学习模型在岩溶隧道涌突水风险预测中凭借其高精度、客观性和高计算效率,克服了知识驱动模型的一些局限性,但因其预测结果难以解释而发展受限。通过随机森林、支持向量机和k-最近邻算法结合贝叶斯优化算法分别构建岩溶隧道涌突水风险预测模型;利用混淆矩阵协同宏平均受试者工作特征(receiver operating characteristic,ROC)曲线开展预测精度验证;最后采用沙普利加性解释(Shapley additive explanations,SHAP)算法归因各影响特征对岩溶隧道涌突水风险的贡献与影响方向,并分析了主要影响特征在模型中的作用机制。结果表明:在测试集上,经贝叶斯优化后的随机森林机器学习模型的准确率(0.7273)、宏平均ROC曲线下的面积(area under curve,AUC)值(0.92)均高于其他2个机器学习模型,能够较为准确地预测岩溶隧道涌突水风险;采用SHAP算法对随机森林机器学习模型中的输入影响特征进行量化,发现围岩分级、降雨入渗系数、隧道所处水动力分带是岩溶隧道涌突水风险的主要影响特征,并分析了各影响特征在模型预测中对岩溶隧道涌突水风险的具体影响,发现其在机器学习模型中的作用机制与相关理论分析结果具有较好的一致性,此一致性显著增强了机器学习模型的可信度。优化后的随机森林模型具有较高的预测精度和良好的可解释性,可为岩溶隧道涌突水风险预测提供理论支持。 展开更多
关键词 沙普利加性解释(shap)算法 机器学习 岩溶隧道 涌突水风险预测
在线阅读 下载PDF
基于可解释性机器学习的餐厨垃圾浆液厌氧产气性能与关键影响因素
18
作者 崔杰 张波 王荣建 《净水技术》 2026年第2期89-100,119,共13页
【目的】餐厨垃圾浆液厌氧消化系统因进料特征复杂、多因素动态耦合,使得其预测与调控具有较大挑战。【方法】为实现工业规模厌氧反应过程的精准管理与优化,本文收集2019年—2023年上海某工业规模厌氧反应器运行数据,分别利用随机森林... 【目的】餐厨垃圾浆液厌氧消化系统因进料特征复杂、多因素动态耦合,使得其预测与调控具有较大挑战。【方法】为实现工业规模厌氧反应过程的精准管理与优化,本文收集2019年—2023年上海某工业规模厌氧反应器运行数据,分别利用随机森林、梯度提升、K邻近回归与人工神经网络(ANN)建立产气预测模型,并通过沙普利加和解释(SHAP)算法量化各输入变量对产甲烷效率的贡献与抑制作用。【结果】梯度提升模型在测试集中R^(2)最高,均方误差(MSE)与平均绝对误差(MAE)最低,预测精度与稳健性优于K邻近回归、随机森林以及ANN模型。结合最优模型的SHAP分析发现:进水化学需氧量(COD)较高时易引发酸化失稳;氨氮质量浓度约1500 mg/L时有利于微生物活性,但过高则抑制产气;pH值低于6.2时,产气效率显著下降。【结论】可解释性机器学习方法可有效提升沼气产量预测的准确性,并帮助快速定位与调控核心影响因素,实现对餐厨垃圾厌氧消化系统的精准管理与持续优化,对其规模化推广具有重要意义。 展开更多
关键词 厌氧消化 餐厨垃圾 机器学习 性能预测 沙普利加和解释(shap)
在线阅读 下载PDF
武陵山区生态系统服务动态演变及其驱动因素的交互效应
19
作者 袁滈 汤弟伟 +3 位作者 刘恒 江源源 刘慧 刘澳 《环境科学》 北大核心 2026年第1期431-443,共13页
深入了解关键地区生态系统服务的时空演变特征及其驱动因素的交互效应,有助于制定精准的生态系统管理方案,促进区域生态系统服务的可持续供应.以重点生态功能区武陵山区为例,首先使用InVEST模型评估了该区4种关键生态系统服务并构建了ME... 深入了解关键地区生态系统服务的时空演变特征及其驱动因素的交互效应,有助于制定精准的生态系统管理方案,促进区域生态系统服务的可持续供应.以重点生态功能区武陵山区为例,首先使用InVEST模型评估了该区4种关键生态系统服务并构建了MESLI,然后采用XGBoost-SHAP分析了MESLI驱动因素的重要程度、交互效应,最后利用RCS明确驱动因素的影响阈值.结果表明:(1)2001~2020年武陵山区的各生态系统服务呈上升趋势,MESLI的均值由1.768上升至1.992,且具有显著的空间异质性,空间分布呈现东南部和西部低,北部和南部高.(2)影响MESLI的主要驱动因素是年降水量,贡献度为0.16,其次是耕地面积占比,贡献度为0.11.(3)驱动因素间存在显著的交互作用,在耕地面积占比高的地区,随着植被覆盖度和坡度的增加,对MESLI的负向影响减弱,并逐渐转变为正向影响;在人类活动足迹多的地区,随着坡度和植被覆盖度的增加,对MESLI的负向影响减弱,并逐渐转变为正向影响;在植被覆盖度低的地区,随着坡度的增加,对MESLI的影响由负向影响转变为正向影响.(4)驱动因素在交互作用影响下对MESLI的影响阈值分别为:耕地面积占比(22.91%)、年降水量(1 542.47 mm)、植被覆盖度(0.63)、坡度(15.17°)、潜在蒸散发(957.93 mm)、年平均气温(15.26℃)、高程(653.96 m)和人类活动足迹(11.56).研究结果可为武陵山区生态系统管理措施的制定提供方法参考与决策依据. 展开更多
关键词 生态系统服务(ESs) 驱动因素 交互效应 极限梯度提升(XGBoost) shapely加性解释(shap) 武陵山区
原文传递
Multi-source remote sensing and machine learning reveal spatiotemporal variations and drivers of NPP in the Tianshan Mountains,China
20
作者 LI Jiani XU Denghui +2 位作者 XU Zhonglin WANG Yao YANG Jianjun 《Journal of Arid Land》 2026年第1期56-83,共28页
Arid mountain ecosystems are highly sensitive to hydrothermal stress and land use intensification,yet where net primary productivity(NPP)degradation is likely to persist and what drives it remain unclear in the Tiansh... Arid mountain ecosystems are highly sensitive to hydrothermal stress and land use intensification,yet where net primary productivity(NPP)degradation is likely to persist and what drives it remain unclear in the Tianshan Mountains of Northwest China.We integrated multi-source remote sensing with the Carnegie–Ames–Stanford Approach(CASA)model to estimate NPP during 2000–2020,assessed trend persistence using the Hurst exponent,and identified key drivers and nonlinear thresholds with Extreme Gradient Boosting(XGBoost)and SHapley Additive exPlanations(SHAP).Total NPP averaged 55.74 Tg C/a and ranged from 48.07 to 65.91 Tg C/a from 2000 to 2020,while regional mean NPP rose from 138.97 to 160.69 g C/(m^(2)·a).Land use transfer analysis showed that grassland expanded mainly at the expense of unutilized land and that cropland increased overall.Although NPP increased across 64.11%of the region during 2000–2020,persistence analysis suggested that 53.93%of the Tianshan Mountains was prone to continued NPP decline,including 36.41%with significant projected decline and 17.52%with weak projected decline;these areas formed degradation hotspots concentrated in the central and northern Tianshan Mountains.In contrast,potential improvement was limited(strong persistent improvement:4.97%;strong anti-persistent improvement:0.36%).Driver attribution indicated that land use dominated NPP variability(mean absolute SHAP value=29.54%),followed by precipitation(16.03%)and temperature(11.05%).SHAP dependence analyses showed that precipitation effects stabilized at 300.00–400.00 mm,and temperature exhibited an inverted U-shaped response with a peak near 0.00°C.These findings indicated that persistent degradation risk arose from hydrothermal constraints interacting with land use conversion,highlighting the need for threshold-informed,spatially targeted management to sustain carbon sequestration in arid mountain ecosystems. 展开更多
关键词 net primary productivity(NPP) Carnegie-Ames-Stanford Approach(CASA) Hurst exponent land use change Extreme Gradient Boosting(XGBoost) shapley additive explanations(shap) hydrothermal thresholds
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部