期刊文献+
共找到393篇文章
< 1 2 20 >
每页显示 20 50 100
Predicting viscosity of multiple slag system using BO-CatBoost and SHapley Additive exPlanations analysis
1
作者 Zi-cheng Xin Jiang-shan Zhang +2 位作者 Mo Lan Ming-zhi Zhang Qing Liu 《Journal of Iron and Steel Research International》 2025年第12期4229-4239,共11页
Slag viscosity plays a crucial role in the smelting process.A slag viscosity prediction model was developed by integrating hyperparameter optimization algorithms,machine learning,and SHapley Additive exPlanations(SHAP... Slag viscosity plays a crucial role in the smelting process.A slag viscosity prediction model was developed by integrating hyperparameter optimization algorithms,machine learning,and SHapley Additive exPlanations(SHAP)analysis.The developed slag viscosity prediction models were evaluated using multiple statistical metrics,leading to the identification of the optimal model—Bayesian optimization-based categorical boosting(BO-CatBoost).And this model was further compared with existing models,including NPL model,FactSage+Roscoe-Einstein(RE)equation,artificial neural network model+RE equation,Riboud model+RE equation,and Zhang model.The results indicate that the slag viscosity prediction model based on BO-CatBoost outperforms all other models,achieving a coefficient of determination of 0.9897,a root mean square error of 1.0619,a mean absolute error of 0.6133,and a hit ratio of 95.1%.The global interpretability analysis of SHAP analysis was used to reveal the importance degree of different features on slag viscosity.The local interpretability analysis of SHAP analysis was used to obtain the quantitative influence of different features on slag viscosity in specific samples.The high-accuracy and interpretable slag viscosity prediction model developed is beneficial to the intelligent design of slag composition. 展开更多
关键词 VISCOSITY Multiple slag system Machine learning shap analysis
原文传递
基于XGBoost+SHAP揭示四川生态脆弱性的驱动力因子及其生态保护评估
2
作者 陈柄桦 李状 +5 位作者 粟丰 张明山 刘瑞 白景昊 张云辉 罗欢 《地质通报》 北大核心 2026年第1期105-120,共16页
【研究目的】通过植被净初生产力单指标结合机器学习方法,克服传统综合指标体系的主观性局限,定量解析驱动机制,为四川省国土空间分区管控、生态保护修复及生态保护评估提供科学依据。【研究方法】基于IPCC生态脆弱性定义,以四川省2001... 【研究目的】通过植被净初生产力单指标结合机器学习方法,克服传统综合指标体系的主观性局限,定量解析驱动机制,为四川省国土空间分区管控、生态保护修复及生态保护评估提供科学依据。【研究方法】基于IPCC生态脆弱性定义,以四川省2001—2023年植被净初级生产力(NPP)为单一评价指标,结合空间自相关、热点分析与XGBoost+SHAP机器学习模型,系统揭示四川省生态脆弱性空间格局及驱动因子影响程度。【研究结果】研究显示:①四川省生态脆弱性整体较高,70%的区域处于中度及以上脆弱水平,空间分布呈西高东低特征,极度脆弱区集中于盆地边缘及横断山脉;②生态脆弱性受自然与人类活动因子交互作用控制,Pearson相关分析显示高程、平均气温、地表温度、降雨等为关键自然驱动因子,而SHAP值定量表明土地利用程度(贡献度最高)、地表温度及平均气温是核心驱动因素;③生态脆弱性空间集聚显著,热点区集中于川西高原及盆地边缘。【结论】生态脆弱性在空间上呈现显著的正相关关系,生态敏感性的空间集聚程度最高,其次为脆弱性,适应性则最低;土地利用程度、地表温度及平均气温是影响生态脆弱性指数变化的主要驱动因子。 展开更多
关键词 生态脆弱性 净初级生产力 Pearson相关分析 XGBoost shap 生态地质调查工程 四川省
在线阅读 下载PDF
Modeling and analysis of independent mobility among older adults based on CatBoost-SHAP
3
作者 CHEN Yuexia DU Wanru +1 位作者 JING Peng YAO Yusen 《Journal of Southeast University(English Edition)》 2025年第4期457-464,共8页
Ensuring independent mobility for older adults has become a public health and social concern in China owing to its rapidly aging population.To explore independent mobility trends among older adults and the impact of s... Ensuring independent mobility for older adults has become a public health and social concern in China owing to its rapidly aging population.To explore independent mobility trends among older adults and the impact of sociodemo-graphic characteristics in recent years,this study used data from the Chinese Longitudinal Healthy Longevity Survey from 2012 to 2018,combined with binomial logit regression and CatBoost-Shapley additive explanation(SHAP)method to analyze the relationship between independent mobility and sociodemographic characteristics under bus and walking-oriented environments.Study findings indicated that age and gender significantly affected the independent mobility of older adults.Policymaking should prioritize the needs of older adults,focusing on age and gender differ-ences.Additionally,living expense adequacy significantly influenced independent mobility.Policies should substan-tially support economically disadvantaged older adults,en-suring their basic needs are met through subsidies and other measures.Moreover,the study found a notable impact of widowhood on independent mobility,suggesting enhanced social care and mental health support for widowed older adults,especially those who are long-lived.The outcomes of this study provided evidence for policymakers,which are beneficial for developing elderly-friendly travel policies to ensure and enhance the quality of life and independent mo-bility of older adults. 展开更多
关键词 independent mobility cohort analysis shap-ley additive explanation(shap) CatBoost model
在线阅读 下载PDF
基于机器学习和SHAP分析的城际儿科患者流动影响因素研究
4
作者 陈俊霖 肖翠萍 +1 位作者 杨翠丽 付谦 《卫生软科学》 2026年第3期11-16,共6页
[目的]从机器学习与可解释性分析视角出发,探讨城际儿科患者流动的关键影响因素及其非线性效应,为优化儿科医疗资源区域配置、推动分级诊疗体系建设提供量化依据。[方法]基于2019—2023年湖北省城际儿科患者流动数据,结合医疗资源、社... [目的]从机器学习与可解释性分析视角出发,探讨城际儿科患者流动的关键影响因素及其非线性效应,为优化儿科医疗资源区域配置、推动分级诊疗体系建设提供量化依据。[方法]基于2019—2023年湖北省城际儿科患者流动数据,结合医疗资源、社会经济、地理距离与公共卫生冲击四类指标,构建XGBoost机器学习模型,预测儿科患者流动规模,并采用SHAP方法解析关键影响因素。[结果]模型在验证集上决定系数(R^(2))达0.910,具备良好预测能力。SHAP分析显示,流入地儿科医师数、城际距离和区域人均可支配收入相对值为三大关键因素,其影响均呈现非线性特征,并识别出显著促进或抑制流动的阈值点。[结论]通过机器学习方法揭示了城际儿科患者流动的关键规律,为儿科医疗资源的科学配置与分级诊疗体系的完善提供了实证支持。 展开更多
关键词 儿科患者流动 机器学习 shap分析 医疗资源配置
在线阅读 下载PDF
A Study on the Inter-Pretability of Network Attack Prediction Models Based on Light Gradient Boosting Machine(LGBM)and SHapley Additive exPlanations(SHAP)
5
作者 Shuqin Zhang Zihao Wang Xinyu Su 《Computers, Materials & Continua》 2025年第6期5781-5809,共29页
The methods of network attacks have become increasingly sophisticated,rendering traditional cybersecurity defense mechanisms insufficient to address novel and complex threats effectively.In recent years,artificial int... The methods of network attacks have become increasingly sophisticated,rendering traditional cybersecurity defense mechanisms insufficient to address novel and complex threats effectively.In recent years,artificial intelligence has achieved significant progress in the field of network security.However,many challenges and issues remain,particularly regarding the interpretability of deep learning and ensemble learning algorithms.To address the challenge of enhancing the interpretability of network attack prediction models,this paper proposes a method that combines Light Gradient Boosting Machine(LGBM)and SHapley Additive exPlanations(SHAP).LGBM is employed to model anomalous fluctuations in various network indicators,enabling the rapid and accurate identification and prediction of potential network attack types,thereby facilitating the implementation of timely defense measures,the model achieved an accuracy of 0.977,precision of 0.985,recall of 0.975,and an F1 score of 0.979,demonstrating better performance compared to other models in the domain of network attack prediction.SHAP is utilized to analyze the black-box decision-making process of the model,providing interpretability by quantifying the contribution of each feature to the prediction results and elucidating the relationships between features.The experimental results demonstrate that the network attack predictionmodel based on LGBM exhibits superior accuracy and outstanding predictive capabilities.Moreover,the SHAP-based interpretability analysis significantly improves the model’s transparency and interpretability. 展开更多
关键词 Artificial intelligence network attack prediction light gradient boosting machine(LGBM) shapley Additive explanations(shap) INTERPRETABILITY
在线阅读 下载PDF
Research on the Issue of False Explanations in Artificial Intelligence for Medical Image Analysis
6
作者 Weihan Jia 《Expert Review of Chinese Medical》 2025年第3期24-32,共9页
Deep learning models have become a core technological tool in the field of medical image analysis.However,these models often suffer from a lack of transparency in their decision-making processes,leading to challenges ... Deep learning models have become a core technological tool in the field of medical image analysis.However,these models often suffer from a lack of transparency in their decision-making processes,leading to challenges related to trust and interpret ability in clinical applications.To address this issue,explainable artificial intelligence(XAI)techniques have been applied to medical image analysis.While showing promising potential,XAI also brings significant ethical risks in practice—most notably,the problem of spurious explanations.Such explanations may rise further concerns regarding patient privacy,data security,and the attribution of decisionmaking authority in medical contexts.This paper analyzes the application of XAI methods—particularly saliency aps—in medical image interpretation,identifies the underlying causes of spurious explanations,and proposes possible mitigation strategies.The aim is to contribute to the responsible and sustainable integration of explainable AI into clinical practice. 展开更多
关键词 medical image analysis explainable artificial intelligence spurious explanation
在线阅读 下载PDF
基于可解释机器学习与SHAP值的精神分裂症患者攻击行为风险预测研究
7
作者 吴青青 沈藕英 陈琳霞 《医院管理论坛》 2026年第1期65-71,共7页
目的通过可解释的机器学习(ML)技术,提高对精神分裂症患者攻击行为风险的预测准确性。方法选取我院2022年1月—2024年6月间收治的529例精神分裂症患者作为研究对象。通过Boruta筛选患者攻击行为特征,以3∶2比例随机分为317例训练集和21... 目的通过可解释的机器学习(ML)技术,提高对精神分裂症患者攻击行为风险的预测准确性。方法选取我院2022年1月—2024年6月间收治的529例精神分裂症患者作为研究对象。通过Boruta筛选患者攻击行为特征,以3∶2比例随机分为317例训练集和212例测试集,8种ML模型10倍交叉验证。结果Boruta算法筛选出8个重要特征变量,包括CTQ-SF、BPRS、HDL、SES、MLR、PANSS阳性症状评分、PANSS一般精神病理评分和PLR。其中,XGBoost模型在ROC曲线中的AUC值最高。CTQ-SF、BPRS和HDL是预测攻击行为风险最重要的三个特征变量。结论XGBoost模型在预测攻击行为风险方面具有较高的准确性和临床价值,通过SHAP值解释,提升了模型的透明性和解释性,有助于临床医生更好地理解模型预测结果。 展开更多
关键词 精神分裂症 机器学习 Boruta算法 shapley加性解释 风险预测
暂未订购
基于D-P屈服准则考虑剪胀性的深部围岩弹塑性解析及其敏感性SHAP分析
8
作者 韩磊 卜玉峰 《有色金属(矿山部分)》 2026年第1期173-183,共11页
针对深部巷道围岩稳定性分析中传统强度准则未考虑中间主应力及剪胀性的问题,基于Drucker-Prager(D-P)屈服准则,建立了考虑剪胀性的围岩弹塑性解析模型。通过引入中间主应力系数(s)量化三向应力状态,结合非关联流动法则定义塑性区与破... 针对深部巷道围岩稳定性分析中传统强度准则未考虑中间主应力及剪胀性的问题,基于Drucker-Prager(D-P)屈服准则,建立了考虑剪胀性的围岩弹塑性解析模型。通过引入中间主应力系数(s)量化三向应力状态,结合非关联流动法则定义塑性区与破裂区扩容系数,推导了弹性区、塑性残余区及破裂区的应力-应变表达式与分区半径解析解。采用SHAP(Shapley Additive exPlanations)值方法,量化分析了中间主应力系数、剪胀角等12个参数对塑性区半径(R_(p))和破裂区半径(Rz)的影响程度及非线性特征。结果表明:中间主应力系数对分区半径的影响呈非线性,在0.4~0.8区间影响稳定;塑性区剪胀角主要促进塑性区扩展并抑制破裂区发展;破裂区剪胀角对破裂区半径的影响受多因素耦合调控。SHAP分析揭示塑性区内摩擦角、原岩应力和开挖半径是影响分区半径的关键参数,其重要性显著高于弹性模量、泊松比等物理参数。研究成果为深部巷道围岩稳定性分析提供了考虑多物理场耦合的理论模型,且SHAP方法为复杂岩土工程参数敏感性分析提供了新途径。 展开更多
关键词 Drucker-Prager屈服准则 中间主应力系数 剪胀性 shap分析 围岩稳定性
在线阅读 下载PDF
基于特征工程优化和SHAP解释方法预测圆钢管约束混凝土短柱轴压承载力 被引量:4
9
作者 韦建刚 吴洵桢 +1 位作者 郑裔 杨艳 《东南大学学报(自然科学版)》 北大核心 2025年第5期1328-1336,共9页
以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构... 以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构中常见的9个特征的相关性以及冗余性,从13个机器学习模型中筛选出梯度提升树(GBDT)、随机森林(Random Forest)、极端梯度提升(XGBoost)和极端随机树(Extra Trees)四个最优模型对STCC的极限轴压承载力N_(u)进行预测,并采用SHAP可解释方法对4种模型进行可视化对比分析。研究表明:截面含钢率α在统计分析中方差趋于零且与径厚比B/t呈完全负相关关系;约束效应系数ζ在F检验中与N_(u)的显著性水平小于5%,斯皮尔曼、皮尔森以及互信息量相关性分析均表明其与N_(u)弱相关。通过SHAP方法对上述4种模型可视化发现,XGBoost在测试集上的表现尤为突出,其决定系数R^(2)(0.9626)、均方根误差(287.40 kN)、平均绝对误差(139.13 kN)以及平均绝对百分比误差(5.1%)均为4个模型中的最低值。此外,XGBoost在泛化能力和避免过拟合方面也表现出色,因此更适用于STCC短柱轴压承载力预测。 展开更多
关键词 机器学习 特征工程 shap解释方法 圆钢管约束混凝土 轴压承载力 特征重要性分析
在线阅读 下载PDF
一种兼具精度与可解释性的Stacking-SHAP滑坡易发性预测集成方法 被引量:1
10
作者 黄鑫 叶健 +3 位作者 刘骋冰 曾秋雨 郭万新 郭志凯 《测绘学报》 北大核心 2025年第10期1826-1840,共15页
滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性... 滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性预测的准确性与诱因分析的可靠性。本文方法采用Stacking集成框架,融合XGBoost、CatBoost、LightGBM、逻辑回归(LR)、随机森林(RF)等多种机器学习分类器,在保证预测精度的基础上,引入SHAP(shapley additive explanations)算法,以增强模型的可解释性。试验结果表明,Stacking-SHAP模型的AUC值达到0.920,显著优于单一分类器模型,如XGBoost(0.893)、CatBoost(0.894)、LightGBM(0.879)、RF(0.859)和LR(0.794)。更重要的是,相较于SHAP集成单一机器学习模型,Stacking-SHAP可解释增强集成模型在滑坡诱因分析方面表现出更优的综合性能,提高了滑坡致灾因素分析的可信度。整体而言,本文方法兼具高精度预测与高可靠性解释,为滑坡易发性预测与诱因分析提供了一种创新性方法,在滑坡防治与减灾领域具有重要的理论与应用价值。 展开更多
关键词 滑坡易发性 地理大数据 Stacking算法 shap算法 滑坡诱因分析
在线阅读 下载PDF
基于CatBoost和SHAP的高级别自动驾驶车辆非预期停车冲突风险预测
11
作者 刘擎超 王瑞海 +2 位作者 蔡英凤 王海 陈龙 《汽车安全与节能学报》 北大核心 2025年第1期170-180,共11页
针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,... 针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,构建了冲突风险预测模型。结果表明,接管次数在城市中心、住宅区和郊区分别为161次、227次和164次,最高单路段接管次数分别为11次、11次和16次;模型预测精度达93%以上。SHAP分析显示,前后车辆间相对速度和相对位置对冲突风险的影响显著。研究结果对提升自动驾驶车辆的可靠性和安全性具有重要意义。 展开更多
关键词 冲突风险 交通排放 高级别自动驾驶 CatBoost算法 shap解释模型
在线阅读 下载PDF
中国西部地区心脏手术患者术后不良预后的预测模型研究:结合机器学习与SHAP解释
12
作者 李帆 胡振飞 +2 位作者 詹海婷 黄一丹 戴晓雯 《中国胸心血管外科临床杂志》 北大核心 2025年第10期1393-1403,共11页
目的构建并比较5种机器学习模型对心脏手术患者术后不良预后的预测效果,通过SHAP(SHapley Additive exPlanations)可解释性分析识别关键决策因素。方法回顾性收集新疆医科大学第一附属医院2023年成人心脏手术患者的围术期数据(包括人口... 目的构建并比较5种机器学习模型对心脏手术患者术后不良预后的预测效果,通过SHAP(SHapley Additive exPlanations)可解释性分析识别关键决策因素。方法回顾性收集新疆医科大学第一附属医院2023年成人心脏手术患者的围术期数据(包括人口学信息、术前指标、术中指标和术后指标)88项,定义患者在心脏手术术后住院期间发生急性肾损伤和/或院内死亡为术后不良预后。根据患者是否发生术后不良预后分为不良预后组和良好预后组。使用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归方法筛选出特征变量后,构建5种机器学习模型:极限梯度提升(eXtreme gradient boosting,XGBoost)、随机森林(random forest,RF)、梯度提升机(gradient boosting machine,GBM)、轻量梯度提升机(light gradient boosting machine,LightGBM)及广义线性模型(generalized linear model,GLM)。数据集按照7∶3的比例,通过分层抽样(以术后预后情况为分层因素)随机分为训练集和测试集。通过受试者工作特征曲线、决策曲线分析及F1 Score等评估模型性能,应用SHAP方法进行特征贡献度解析。结果共纳入患者639例,其中男395例、女244例,中位年龄为62(55,69)岁。不良预后组191例、良好预后组448例,术后不良预后发生率为29.9%。单因素分析中两组各变量差异无统计学意义(P>0.05)。使用LASSO回归筛选出16个特征变量(体外循环辅助时间、术后第3天血糖、肌酸激酶同工酶-MB、全身炎症反应指数等),构建了5种机器学习模型(GLM、RF、GBM、LightGBM、XGBoost)。评估结果显示:XGBoost模型在训练集(n=447)和测试集(n=192)上均表现出最优的预测效能,曲线下面积分别为0.761[95%CI(0.719,0.800)]、0.759[95%CI(0.692,0.818)],并在测试集中阳性预测值和平衡准确度上均优于其他模型。决策曲线分析进一步验证其在多种风险阈值下的临床实用性。SHAP分析提示,体外循环辅助时间、术后第3天血糖、肌酸激酶同工酶-MB及炎症指标(全身炎症反应指数、中性粒细胞与淋巴细胞比值、C反应蛋白与白蛋白比值)等变量对预测贡献度较高。结论XGBoost模型可有效预测心脏术后不良预后,临床应重点关注体外循环辅助时间、控制术后血糖及监测炎症水平来改善患者预后。 展开更多
关键词 极限梯度提升 机器学习 术后风险预测 shap分析 心脏手术
原文传递
基于分层时空框架的共享单车需求预测:LP-TFT模型与SHAP可解释分析
13
作者 李聪颖 袁锴璐 +3 位作者 李静怡 郑晓晶 李坤 何源 《中国公路学报》 北大核心 2025年第10期305-323,共19页
为揭示共享单车系统需求演变规律,并明确不同因素对需求的影响,提出一种融合特征解耦与深度学习的集群-站点级分层时空预测框架。首先,基于站点间的关联性与相似性改进LP算法,构建站点集群划分模型,其中关联性通过空间距离与出行流量表... 为揭示共享单车系统需求演变规律,并明确不同因素对需求的影响,提出一种融合特征解耦与深度学习的集群-站点级分层时空预测框架。首先,基于站点间的关联性与相似性改进LP算法,构建站点集群划分模型,其中关联性通过空间距离与出行流量表征,相似性通过POI相似度与历史出行量相似度加权表征;引入借还不平衡差异指数评价聚类效果,以最小化借还不平衡差异指数为目标进行站点集群划分;在此基础上,分别建立基于TFT模型的集群级与站点级需求预测模型,并将集群级预测结果整合进站点级预测过程中;最后,运用SHAP方法解析不同因素对集群级与站点级共享单车需求的影响机制。研究结果表明:集群级需求预测过程中,小时特征对集群级需求的影响最显著,表现为夜间抑制、日间促进,气象因素呈现双向调节作用,在温度适中、气压较高、风速与湿度较低时对需求产生促进作用;站点级需求预测过程中,集群需求为核心影响因素,随着集群级结果的引入,站点级预测结果的决定系数R^(2)由0.7679提升至0.8504,平均绝对误差MAE由1.2152降至0.9755,误差降低约19.73%;气象因素在站点层级展现出一定的独立影响趋势,如在部分低温、高湿或风速较大的情境下仍可能促进需求,表明站点级需求不仅依赖于集群需求的整体波动,还受站点周边环境的影响,具有一定独立性。研究构建了基于分层时空框架的共享单车需求预测方法,可为共享单车需求驱动因素识别与动态调度提供决策支持。 展开更多
关键词 交通工程 共享单车需求预测 LP算法 TFT算法 shap可解释分析
原文传递
Investigation of feature contribution to shield tunneling-induced settlement using Shapley additive explanations method 被引量:18
14
作者 K.K.Pabodha M.Kannangara Wanhuan Zhou +1 位作者 Zhi Ding Zhehao Hong 《Journal of Rock Mechanics and Geotechnical Engineering》 SCIE CSCD 2022年第4期1052-1063,共12页
Accurate prediction of shield tunneling-induced settlement is a complex problem that requires consideration of many influential parameters.Recent studies reveal that machine learning(ML)algorithms can predict the sett... Accurate prediction of shield tunneling-induced settlement is a complex problem that requires consideration of many influential parameters.Recent studies reveal that machine learning(ML)algorithms can predict the settlement caused by tunneling.However,well-performing ML models are usually less interpretable.Irrelevant input features decrease the performance and interpretability of an ML model.Nonetheless,feature selection,a critical step in the ML pipeline,is usually ignored in most studies that focused on predicting tunneling-induced settlement.This study applies four techniques,i.e.Pearson correlation method,sequential forward selection(SFS),sequential backward selection(SBS)and Boruta algorithm,to investigate the effect of feature selection on the model’s performance when predicting the tunneling-induced maximum surface settlement(S_(max)).The data set used in this study was compiled from two metro tunnel projects excavated in Hangzhou,China using earth pressure balance(EPB)shields and consists of 14 input features and a single output(i.e.S_(max)).The ML model that is trained on features selected from the Boruta algorithm demonstrates the best performance in both the training and testing phases.The relevant features chosen from the Boruta algorithm further indicate that tunneling-induced settlement is affected by parameters related to tunnel geometry,geological conditions and shield operation.The recently proposed Shapley additive explanations(SHAP)method explores how the input features contribute to the output of a complex ML model.It is observed that the larger settlements are induced during shield tunneling in silty clay.Moreover,the SHAP analysis reveals that the low magnitudes of face pressure at the top of the shield increase the model’s output。 展开更多
关键词 feature Selection Shield operational parameters Pearson correlation method Boruta algorithm shapley additive explanations(shap) analysis
在线阅读 下载PDF
基于特征选择的SHAP-Transformer高炉铁水硅含量预报模型 被引量:4
15
作者 马居安 郑华伟 +4 位作者 刘栋梁 陆昊 周进东 毕学工 熊玮 《钢铁》 北大核心 2025年第8期68-78,共11页
数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal c... 数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal component analysis,PCA)将22个分钟级的特征参数转化为铁次级参数,进一步采用滑动窗口和最大信息系数(maximal information coefficient,Cimax)确定了参数的滞后时长。利用随机森林优化的SHAP算法对34个参数在强耦合条件下的重要性进行评估,筛选出7个关键参数。使用SHAP算法优化Transformer的自注意力机制,构建了SHAP-Transformer铁水硅含量预报模型,通过现场数据验证了模型的有效性。结果表明,铁水硅质量分数预测误差为-0.05~0.05和-0.1~0.1时,基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型的命中率最高,分别为72.12%和95.76%,比基于MIC参数选择的SHAP-Transformer模型提高了26.67%和21.21%,比基于滑动窗口时滞分析及耦合参数优选的长短时记忆网络(long short-term memory,LSTM)模型提高了17.57%和9.7%。基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型对铁水硅含量的变化趋势预测也有较高的精度,趋势方向预测的准确率为87.3%,趋势类别预测的准确率为60.5%,研究能够为高炉操作者提前判断炉温变化提供可靠依据。 展开更多
关键词 高炉 铁水硅含量 特征选择 时滞分析 随机森林 shap算法 炼铁 预报模型
原文传递
基于随机森林与SHAP算法的致密砂岩气暂堵效果的影响因素分析
16
作者 黄浩 车恒达 +3 位作者 孔祥伟 辛富斌 向九洲 吉俊杰 《科学技术与工程》 北大核心 2025年第26期11135-11143,共9页
为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂... 为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂堵效果量化模型和公式、暂堵效果算法模型验证,发现暂堵效果量化值与产气贡献率正相关,P=0.037,证明暂堵效果量化模型和公式的准确性高;又因暂堵效果算法模型中,训练集与测试集的MSE、MAE、R^(2)相差微小,证明该模型的泛化能力较强且准确性高。在暂堵效果算法模型的基础之上,开展暂堵效果的影响因素分析,结果表明:总段数、渗透率、暂堵球数量、簇间距和砂比这5个因素对于暂堵效果的影响占比最大。进一步分析单影响因素,发现随总段数增加,暂堵效果增加的规律只适用于直井,对水平井不适用;随渗透率增加,暂堵效果变差;暂堵球数量<50个、簇间距>20 m、砂比介于18%~20%,暂堵效果均可达到正向增长。研究结果可为苏里格等气田现场暂堵作业设计提供借鉴和参考。 展开更多
关键词 苏里格气田 致密砂岩气 暂堵效果 随机森林 shap(shapley additive explanations)值 模型解释
在线阅读 下载PDF
TabPFN与SHAP融合的LF精炼Si元素收得率预测模型
17
作者 信自成 张江山 +1 位作者 张军国 刘青 《中国冶金》 北大核心 2025年第11期178-186,共9页
在钢包炉(LF)精炼过程中,准确预测合金元素收得率对于控制钢水成分、提高合金利用率及降低冶炼成本具有重要意义。近年来机器学习方法被广泛应用于冶金过程建模,但多数机器学习模型在实际应用中通常依赖复杂的超参数调优过程,且引入新... 在钢包炉(LF)精炼过程中,准确预测合金元素收得率对于控制钢水成分、提高合金利用率及降低冶炼成本具有重要意义。近年来机器学习方法被广泛应用于冶金过程建模,但多数机器学习模型在实际应用中通常依赖复杂的超参数调优过程,且引入新数据后往往需要重新调优超参数,建模效率有待提高。针对上述问题,首先,结合LF精炼实际生产数据,构建了基于表格先验数据拟合网络(TabPFN)的Si元素收得率预测模型;然后,利用多种模型评价指标,将TabPFN模型与已有研究的参考炉次法、多元线性回归模型以及多种机器学习模型进行了对比分析;最后,融合沙普利加性解释(SHAP)方法对TabPFN模型进行了全局与局部层面的解释分析。结果表明,TabPFN模型在无需大量超参数调优的情况下,在拟合优度(R^(2))、平均绝对误差(E_(MA))、均方根误差(E_(RMS))、命中率和模型推理时间等关键性能指标上均优于已有模型,各项指标分别达到了0.83、1.59、2.03、98.4%和0.430 s。同时,融合SHAP分析从全局层面揭示了各输入特征变量对Si元素收得率的影响大小,从局部层面量化了各输入特征变量对Si元素收得率预测值的影响程度,实现了LF精炼合金元素收得率的高效、高精度和可解释性预测,为钢铁工业在智能制造背景下的冶金过程建模提供了新的研究思路与技术路径。 展开更多
关键词 LF精炼 Si元素收得率 机器学习 表格先验数据拟合网络 沙普利加性解释
在线阅读 下载PDF
加速钙钛矿太阳能电池开发:基于机器学习驱动框架的SHAP分析
18
作者 梁锐权 刘谦 +4 位作者 胡春华 郑建楂 李阳 王亦文 麦耀华 《发光学报》 北大核心 2025年第11期2138-2149,共12页
钙钛矿太阳能电池(Perovskite solar cells,PSCs)以其高性能在新型太阳能电池技术中占据了重要地位。针对传统实验试错法在提升PSCs的光电转换效率(Power conversion efficiency,PCE)方面存在研究周期长和效率低下的不足,提出了一种基... 钙钛矿太阳能电池(Perovskite solar cells,PSCs)以其高性能在新型太阳能电池技术中占据了重要地位。针对传统实验试错法在提升PSCs的光电转换效率(Power conversion efficiency,PCE)方面存在研究周期长和效率低下的不足,提出了一种基于机器学习(Machine learning,ML)的PSCs制备工艺的智能优化方法。通过应用多种ML算法构建PCE预测模型,最终选择性能卓越的梯度提升(Gradient boosting,GB)模型进行夏普利加性解释(Shapley additive explanations,SHAP)可视化分析和实验验证。实验结果表明,基于模型输出指导的实验使PSCs的PCE达到了21.81%。本工作不仅有效解决了传统实验试错法的局限性,还攻克了ML在PSCs领域应用中预测精度低的难题,为快速开发高PCE的PSCs提供了新视角和科学依据,也为其他新型太阳能电池技术的开发提供了参考。 展开更多
关键词 钙钛矿太阳能电池 机器学习 夏普利加性解释(shap)分析 光电转换效率预测
在线阅读 下载PDF
基于XGBoost与SHAP分析的可解释性故障诊断方法研究
19
作者 李开平 张凤丽 +1 位作者 黄祖广 王金江 《制造技术与机床》 北大核心 2025年第6期199-208,共10页
针对现有智能故障诊断方法存在特征输入单一、故障难以提取、模型可解释性较差等问题,提出一种基于XGBoost(extreme gradient boosting)与SHAP(SHapley Additive exPlanations)分析的可解释性故障诊断方法。首先,采用传统信号处理方法... 针对现有智能故障诊断方法存在特征输入单一、故障难以提取、模型可解释性较差等问题,提出一种基于XGBoost(extreme gradient boosting)与SHAP(SHapley Additive exPlanations)分析的可解释性故障诊断方法。首先,采用传统信号处理方法完成多域特征的提取。其次,基于XGBoost集成算法构建故障诊断模型,并根据XGBoost内嵌评估指标对模型进行初步特征解释。最后,运用Tree SHAP方法对诊断模型进行特征解释分析,探究重要特征对轴承故障类别趋势的影响关系,分析特征之间的依赖交互效应,直观、透明地揭示模型的诊断机制。通过实验对比XGBoost与其他传统机器学习方法,本模型在多维评价指标中综合表现更为突出,且具有较强的精确性,故障诊断准确率高达99.62%,具备良好的实际应用价值。 展开更多
关键词 可解释性故障诊断方法 多域特征 XGBoost集成算法 Tree shap 特征解释
在线阅读 下载PDF
SHAP解释下随机森林预测的越江盾构隧道病害发展分析 被引量:2
20
作者 徐鹏宇 王勇 +1 位作者 王红雪 高翔 《测绘通报》 北大核心 2025年第3期117-121,共5页
我国轨道交通建造技术愈发成熟,但也无法改变富水环境下隧道变形的现状。工程领域对隧道病害成因、影响因素、控制与治理等方面均有较为深入的研究,但对于隧道尤其是越江盾构隧道的病害分布与发展预测领域的研究却很少。为弥补越江盾构... 我国轨道交通建造技术愈发成熟,但也无法改变富水环境下隧道变形的现状。工程领域对隧道病害成因、影响因素、控制与治理等方面均有较为深入的研究,但对于隧道尤其是越江盾构隧道的病害分布与发展预测领域的研究却很少。为弥补越江盾构隧道病害发展预测领域的空白,本文基于三维激光测量技术对某越江段盾构隧道全断面扫描的历史监测数据,利用SHAP解释的随机森林模型预测未来一期监测数据;预测结果精度评估合格后,分析预测数据判断隧道变形发生位置和程度,为地铁运营维护提供依据。 展开更多
关键词 病害发展分析 越江盾构隧道 病害预测 shap 随机森林
原文传递
上一页 1 2 20 下一页 到第
使用帮助 返回顶部