期刊文献+
共找到213篇文章
< 1 2 11 >
每页显示 20 50 100
基于XGBoost-SHAP模型的造船成本估算
1
作者 杨静 苏翔 +1 位作者 吴沣沛 李向远 《船舶工程》 北大核心 2026年第2期129-139,177,共12页
[目的]为提高船舶产品的报价成本、目标成本和预实成本阶段成本估算的效率和准确性,[方法]基于极端梯度提升(XGBoost)算法和沙普利加性解释(SHAP)分析法开展造船成本估算研究。筛选出影响造船成本的关键解释变量,基于SHAP分析法评估各... [目的]为提高船舶产品的报价成本、目标成本和预实成本阶段成本估算的效率和准确性,[方法]基于极端梯度提升(XGBoost)算法和沙普利加性解释(SHAP)分析法开展造船成本估算研究。筛选出影响造船成本的关键解释变量,基于SHAP分析法评估各影响因子对造船成本的影响程度,揭示造船成本的内外部影响机制,明确主要影响因子;在此基础上,构建融合XGBoost算法与SHAP可解释机器学习框架的造船成本估算模型。[结果]研究结果表明:能源价格指数、型深、汇率、工期和数字化转型程度等因素的SHAP值范围为-1×10^(7)~1×10^(7),均对造船成本产生影响;该模型的拟合优度R^(2)达到0.85,平均误差约为4.18%,能支撑准确、高效的造船成本估算;[结论]该模型能为船舶建造“事前筹划”“事中管控”“事后考核”的全流程成本管控提供数据驱动的决策支持。 展开更多
关键词 造船成本 XGBoost-shap模型 可解释框架 机器学习 成本估算
原文传递
基于改进残差网络和SHAP的糖尿病预测及可解释性分析
2
作者 魏国政 魏丽丽 +3 位作者 宋廷强 渠蓉蓉 孙媛媛 董凡琦 《计算技术与自动化》 2026年第1期151-157,共7页
针对糖尿病预测领域中可靠性与可解释性不足问题,提出了基于改进深度残差网络的预测算法。该算法嵌入了根据数据集特性设计的特征自注意力机制,并辅以SHAP模型以增强可解释性。SHAP能够精准定位并可视化影响糖尿病预测的关键因素,提升... 针对糖尿病预测领域中可靠性与可解释性不足问题,提出了基于改进深度残差网络的预测算法。该算法嵌入了根据数据集特性设计的特征自注意力机制,并辅以SHAP模型以增强可解释性。SHAP能够精准定位并可视化影响糖尿病预测的关键因素,提升预测逻辑的透明度与实用价值。实验在Pima公开数据集及青岛某三甲综合医院私有数据集上展开,RAC模型与朴素贝叶斯、逻辑回归、支持向量机等模型进行了对比。结果显示,RAC的分类准确率、灵敏度、特异性、F 1分数值均优于其他模型,验证了其在临床实践中早期预警或辅助诊断的潜力。 展开更多
关键词 糖尿病预测 可解释性 改进深度残差网络 特征自注意力机制 shap模型
在线阅读 下载PDF
基于LightGBM-SHAP的重载货车运输事故严重程度影响因素
3
作者 李帅杰 钱大琳 +1 位作者 方琼 周锦婷 《公路交通科技》 北大核心 2026年第3期1-9,共9页
【目标】目前重载货车交通事故数量逐年上升,重载货车运输事故造成的损害往往更为严重,而分析影响重载货车运输事故严重程度的因素,对重载货车运输事故预防至关重要。【方法】通过收集美国事故记录采样系统数据库中2016—2020年的重载... 【目标】目前重载货车交通事故数量逐年上升,重载货车运输事故造成的损害往往更为严重,而分析影响重载货车运输事故严重程度的因素,对重载货车运输事故预防至关重要。【方法】通过收集美国事故记录采样系统数据库中2016—2020年的重载货车运输事故数据2616条,运用相关性分析和递归特征消除算法进行了特征筛选,从驾驶员、车辆、道路、环境、时间、空间和事故形式7个维度提取了15个影响重载货车事故严重程度的潜在因素,并使用基于K近邻的自适应合成抽样算法(ADASYN)消除了训练集的类别不平衡问题。在数据处理基础上,采用LightGBM,XGBoost,RF和SVM算法分别构建了4种事故严重程度预测模型,然后引入SHAP方法分析了特征因素对事故严重程度的影响机制。【结果】构建的LightGBM模型综合性能最优,就预测性能而言,LightGBM模型预测更准确,其精度、F1值和AUC分别为0.8721,0.8724和0.9669;就训练速度而言,LightGBM模型的训练速度(7.65 s)比XGBoost快2.5倍多,比SVM和RF分别快7倍和16倍。【结论】基于SHAP框架的模型解释显示,碰撞方式、不安全驾驶行为、时段、月份、日期类型、行车道属性是影响事故严重程度的关键因素。其中,酒驾或毒驾、不遵守交通标志或信号、深度疲劳驾驶、超速行驶、违规分心驾驶、正面相撞、角度碰撞,会较大程度促进重伤和死亡事故发生,并且重载货车在0:00—4:00时段发生死亡事故的概率偏高。研究结果可为重载货车运输事故预防及其运输安全管理提供一定理论依据。 展开更多
关键词 智能交通 事故影响因素 LightGBM-shap模型 重载货车 运输事故严重程度
原文传递
基于Logistic回归与SHAP算法的减重代谢手术术后1年高甘油三酯血症缓解的列线图预测模型构建
4
作者 王亮 张能维 +2 位作者 廉东波 杜德晓 孙怡兰 《广西医学》 2026年第3期329-340,共12页
目的分析减重代谢手术术后1年高甘油三酯血症(HTG)缓解的独立预测因子,并构建列线图预测模型。方法纳入术前存在HTG、接受减重代谢手术治疗的136例肥胖患者,并将其随机分为训练集(n=95)与验证集(n=41)。根据术后1年HTG缓解情况,将训练... 目的分析减重代谢手术术后1年高甘油三酯血症(HTG)缓解的独立预测因子,并构建列线图预测模型。方法纳入术前存在HTG、接受减重代谢手术治疗的136例肥胖患者,并将其随机分为训练集(n=95)与验证集(n=41)。根据术后1年HTG缓解情况,将训练集患者分为A组(HTG缓解,n=80)与B组(HTG未缓解,n=15),分析两组的基本临床资料、人体成分分析指标、生化代谢指标、腹部影像学数据。通过单因素和多因素Logistic回归模型筛选与减重代谢手术术后1年HTG缓解相关的独立预测因子,并基于独立预测因子构建列线图预测模型,在训练集和验证集中通过受试者工作特征曲线、校准曲线、决策曲线分析(DCA)与临床影响曲线(CIC)评价模型的预测效能、拟合度及临床实用性。应用SHAP算法,通过特征重要性量化、单样本预测影响解析、SHAP依赖关系分析对预测模型进行可解释性分析。结果B组的2型糖尿病患者比例及术前空腹血糖水平、HbA1c水平、甘油三酯水平、甘油三酯-葡萄糖指数(TYG)、内脏脂肪组织面积(VATA)/皮下脂肪组织面积(SATA)值高于A组,而术前HDL-C水平低于A组(P<0.05)。Logistic回归分析结果表明,TYG与VATA/SATA值为减重代谢手术术后1年HTG缓解的独立预测因子(P<0.05)。模型效能验证结果显示,在训练集、验证集中,基于TYG与VATA/SATA值所构建的列线图预测模型的曲线下面积分别为0.913、0.787,校准曲线提示该模型具有良好的拟合度,DCA与CIC分析提示该模型在不同风险阈值下均能为临床决策带来净获益,临床实用性显著。TYG、VATA/SATA值的平均绝对SHAP值分别为1.354、0.551;两者的特征值均与减重代谢手术术后1年HTG缓解的预测结果呈负向关联,其中TYG的抑制作用更为显著。结论TYG与VATA/SATA值是减重代谢手术术后1年HTG缓解的独立预测因子,其中TYG对预测结果的影响更为显著。二者联合应用可全面反映患者术前糖脂代谢状态与脂肪分布特征,为术后缓解风险评估提供关键依据。 展开更多
关键词 减重代谢手术 高甘油三酯血症 甘油三酯-葡萄糖指数 内脏脂肪组织面积/皮下脂肪组织面积比值 Logistic回归模型 shap算法 可解释性分析
暂未订购
大运河文化带新质生产力的时空分异特征与影响因素——基于机器学习XGBoost-SHAP模型 被引量:5
5
作者 周丙锋 史静 +2 位作者 谢新水 刘晟 曹倩倩 《地域研究与开发》 北大核心 2025年第1期14-22,共9页
采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现... 采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现波动增长态势,相比于绿色生产力、科技生产力,数字生产力占新质生产力比例更大。各地区新质生产力发展水平存在一定差异,北京、江苏、浙江部分地级市为新质生产力发展高峰,河南、安徽为新质生产力发展低谷,且2020年各地新质生产力水平均有所提升。其聚集效应沿大运河呈现“三角”分布现象,且表现出“两角聚集夹分异”的发展趋势。每百人移动电话用户数、全要素劳动生产率等为影响大运河文化带新质生产力水平的主导因素,且各个主导因素之间存在交互效应。 展开更多
关键词 新质生产力 大运河文化带 时空分异 XGBoost-shap模型
在线阅读 下载PDF
基于XGBoost-SHAP可解释机器学习模型的城市形态与地表温度的关系 被引量:21
6
作者 谭洁 危千骏 +3 位作者 廖朝阳 邝文俊 邓慧婷 余德 《应用生态学报》 北大核心 2025年第3期659-670,共12页
随着全球大城市中高层建筑的增多,探讨城市二维(2D)和三维(3D)形态对地表温度(LST)的影响,已成为缓解城市热环境和优化城市规划的关键。本研究以长沙市三环以内地区为例,基于2020年多源遥感数据提取了13项城市2D/3D特征因子,通过Pearso... 随着全球大城市中高层建筑的增多,探讨城市二维(2D)和三维(3D)形态对地表温度(LST)的影响,已成为缓解城市热环境和优化城市规划的关键。本研究以长沙市三环以内地区为例,基于2020年多源遥感数据提取了13项城市2D/3D特征因子,通过Pearson相关性分析探讨LST与各特征因子的线性关系,并引入XGBoost模型和SHAP方法揭示其非线性影响和贡献。结果表明:2020年,高温区域主要分布在长沙市中心的建筑密集区,低温区域主要分布在长沙市西部和东北部的森林公园以及湘江沿岸。归一化建筑指数(NDBI)、夜间灯光(NTL)和建设用地比例(PCL)与LST呈显著正相关关系,相关系数分别为0.592、0.537和0.446,表明城市化进程加剧了地表升温;归一化植被指数(NDVI)、天空视角系数(SVF)与LST呈显著负相关关系,相关系数分别为-0.316和-0.200,体现了绿地和开阔空间对缓解城市热岛的重要作用。NDBI、NTL、NDVI和高程(DEM)对LST的影响最大,总贡献度达60.9%;这些2D/3D形态特征因子对LST的影响呈现复杂的非线性特征,其中,NDBI在0~0.2时,对LST提升最显著;NTL超过40后的增温效应趋于饱和;NDVI超过0.5时,降温效果显著增强;DEM在50~150 m对LST的降温效果最突出。本研究验证了XGBoost-SHAP模型揭示城市2D/3D特征因子对LST的非线性影响机制的有效性,并可为城市热环境治理与缓解,以及绿色、低碳、宜居的新型城镇化建设提供科学依据。 展开更多
关键词 城市2D/3D形态 热岛效应 可解释机器学习 XGBoost-shap模型
原文传递
基于CatBoost-SHAP-MCM模型的关中地区PM_(2.5)浓度的气象影响因素研究 被引量:1
7
作者 苏佳 聂达文 +3 位作者 李晓萌 张新生 宋金昭 董明放 《环境科学研究》 北大核心 2025年第4期787-797,共11页
为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同... 为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同时利用CatBoost-SHAP-MCM模型识别PM_(2.5)浓度的关键气象影响因素。结果表明:①关中地区PM_(2.5)浓度呈明显的空间分布和季节变异性。年际PM_(2.5)浓度在2021年最低,为42.93μg/m^(3),在2022年最高,达49.09μg/m^(3)。季度和月际变化较为相似,均呈冬季高、夏季低的特征,冬季污染最严重,PM_(2.5)浓度达84.35μg/m^(3),夏季最轻,为21.42μg/m^(3)。西安市、咸阳市和渭南市为高污染城市,铜川市和宝鸡市为低污染城市。②PM_(2.5)浓度与PM10浓度的相关性最高,与CO浓度、SO2浓度相关性均较低。③露点温度、气温、海平面气压、降水量和地面气压为关键气象影响因素,其在各城市表现出显著的影响作用,对关中地区整体和各城市的影响基本保持一致。④在低露点温度、低气温以及低露点温度、高海平面气压和高地面气压等特定因素组合下,其对PM_(2.5)浓度的影响更为显著。研究显示,关中地区PM_(2.5)浓度具有明显的空间分异特征和季节性变化特征,且与露点温度、气温、海平面气压、降水量和地面气压等气象因素密切相关,在特定气象组合条件下PM_(2.5)浓度波动更为显著。 展开更多
关键词 关中地区 PM_(2.5) 影响因素 CatBoost-shap-MCM模型
在线阅读 下载PDF
基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型 被引量:1
8
作者 盛武 王灵子 《工矿自动化》 北大核心 2025年第6期21-27,140,共8页
针对目前综采工作面上隅角瓦斯浓度预测模型由于“黑盒”结构导致内部运行逻辑未知、预测结果可解释性弱的问题,提出一种基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型。对综采工作面瓦斯涌出浓度关联监测数据进行相关分析,筛选出特... 针对目前综采工作面上隅角瓦斯浓度预测模型由于“黑盒”结构导致内部运行逻辑未知、预测结果可解释性弱的问题,提出一种基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型。对综采工作面瓦斯涌出浓度关联监测数据进行相关分析,筛选出特征变量;基于XGBoost搭建上隅角瓦斯浓度预测模型,引入SHAP算法计算每个特征变量对预测结果的贡献值,增强模型透明度,为XGBoost提供全局性解释;最后利用现场多源传感监测数据对模型性能进行验证。实例分析结果表明:①XGBoost模型的决定系数R^(2)、平均绝对误差(MAE)、均方根误差(RMSE)分别为0.93,0.007,0.008,相较于随机森林(RF)、支持向量回归(SVR)和梯度提升决策树(GBDT),拟合优度最高,误差最低。②XGBoost模型的平均相对误差为4.478%,相较于对比模型,具有较高的精度与较好的泛化性能。③依据各输入特征的平均绝对SHAP值,工作面T1瓦斯浓度对上隅角瓦斯浓度影响最大,工作面上隅角瓦斯抽采管道内瓦斯浓度次之,回采煤层瓦斯含量、回采煤层顶板压力等紧随其后,说明XGBoost能捕捉变量间的非线性关系和交互作用,SHAP算法可为XGBoost模型提供全局性解释。 展开更多
关键词 瓦斯浓度预测 上隅角瓦斯溯源 XGBoost模型 shap 可解释性
在线阅读 下载PDF
An Interpretable Prediction Model for Stroke Based on XGBoost and SHAP
9
作者 Tianshu Fang Jiacheng Deng 《Journal of Clinical and Nursing Research》 2023年第3期96-106,共11页
Objective:To establish a stroke prediction and feature analysis model integrating XGBoost and SHAP to aid the clinical diagnosis and prevention of stroke.Methods:Based on the open data set on Kaggle,with the help of d... Objective:To establish a stroke prediction and feature analysis model integrating XGBoost and SHAP to aid the clinical diagnosis and prevention of stroke.Methods:Based on the open data set on Kaggle,with the help of data preprocessing and grid parameter optimization,an interpretable stroke risk prediction model was established by integrating XGBoost and SHAP and an explanatory analysis of risk factors was performed.Results:The XGBoost model’s accuracy,sensitivity,specificity,and area under the receiver operating characteristic(ROC)curve(AUC)were 96.71%,93.83%,99.59%,and 99.19%,respectively.Our explanatory analysis showed that age,type of residence,and history of hypertension were key factors affecting the incidence of stroke.Conclusion:Based on the data set,our analysis showed that the established model can be used to identify stroke,and our explanatory analysis based on SHAP increases the transparency of the model and facilitates medical practitioners to analyze the reliability of the model. 展开更多
关键词 Stroke risk prediction XGBoost algorithm shap model Risk factor analysis
暂未订购
应用SHAP可解释机器学习模型估测森林蓄积量 被引量:4
10
作者 王元 王玥 +3 位作者 周宇琛 陈伏生 张绿水 刘牧 《东北林业大学学报》 北大核心 2025年第5期66-73,共8页
森林蓄积量是反映森林资源丰富程度的关键指标,精确估测森林蓄积量对于森林资源管理至关重要。以江西省林区为研究对象,运用谷歌地球引擎(Google Earth Engine)平台从Landsat 8遥感影像中提取多个植被指数、单波段及组合特征,并结合国... 森林蓄积量是反映森林资源丰富程度的关键指标,精确估测森林蓄积量对于森林资源管理至关重要。以江西省林区为研究对象,运用谷歌地球引擎(Google Earth Engine)平台从Landsat 8遥感影像中提取多个植被指数、单波段及组合特征,并结合国家森林资源连续清查的地面实测数据,分析不同影像特征参数在森林蓄积量反演中的贡献率。结果表明:对比多元线性回归、神经网络、随机森林和XGBoost模型估测森林蓄积量的精度,随机森林模型估测精度为93.3%,决定系数(R^(2))为0.9337,均方根误差为2.2323,平均绝对误为2.3395;与BP神经网络模型(R^(2)=0.8219)和XGBoost模型(R^(2)=0.7916)相比,模型拟合度和预测效果更佳,比多元线性回归模型(R^(2)=0.688)处理非线性关系的稳定性和可靠性更高。通过解释特征参数的相对重要性,揭示出平均胸径、郁闭度等特征对森林蓄积量影响显著,且随机森林模型中各因子间存在相互作用。 展开更多
关键词 shap解释模型 机器学习模型 森林蓄积量
在线阅读 下载PDF
基于XGBoost-SHAP方法的陕西省PM_(2.5)影响因素分析 被引量:11
11
作者 赵兴赟 张强 +4 位作者 杨方社 郑烈龙 罗嘉昕 史治辉 问思路 《环境科学研究》 北大核心 2025年第5期990-999,共10页
陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气... 陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气污染物数据集,对陕西省PM_(2.5)浓度的时空变化特征进行研究,通过构建XGBoost模型并结合SHAP方法,分析陕西省PM_(2.5)浓度与气象、地形及植被因素和社会经济因素的关系,阐明各因素对PM_(2.5)浓度的时空影响。结果表明:①时间上,2013−2022年陕西省PM_(2.5)浓度整体呈现下降趋势,年均浓度最大值(56.02μg/m^(3))出现在2013年,在2019−2022年PM_(2.5)年均浓度低于《环境空气质量标准》(GB 3095−2012)二级标准限值(35μg/m^(3));空间上,陕西省呈现“关中高、陕南和陕北低”的污染空间格局。②在所研究的影响因素中,XGBoost-SHAP方法揭示了影响陕西省PM_(2.5)浓度的主要因素依次为高程、相对湿度、温度和人口密度,其中,高程和相对湿度对陕西省PM_(2.5)浓度具有负向影响,而温度和人口密度则表现为正向影响。③通过划分影响区发现,陕北、关中及陕南地区PM_(2.5)主要影响因素的作用方向与影响强度存在显著的空间异质性。研究显示,2013−2022年陕西省PM_(2.5)浓度大幅下降,PM_(2.5)的主要影响因素在不同区域存在空间差异,治理PM_(2.5)污染需要综合考虑区域异质性与多重影响因素的协同作用。 展开更多
关键词 PM_(2.5) XGBoost模型 shap方法 时空特征 影响因素
在线阅读 下载PDF
基于机器学习和SHAP算法的声波测井曲线重构及可解释性分析 被引量:11
12
作者 黎子豪 蒋恕 《地质科技通报》 北大核心 2025年第1期321-331,共11页
测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间... 测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间的关系模型使得曲线重构精度相对较低,机器学习算法虽能在大量数据之间找到最为合适的数据映射关系进而提高模型精度,但相较而言其所构建的黑箱模型无法得到良好的解释。近期,可解释性算法的运用使得机器学习在重构测井曲线中的应用更为合理。通过将支持向量回归(support vector regression,简称SVR),随机森林(random forest,简称RF)以及极限梯度提升(extreme gradient boosting,简称XGBoost)和传统多元线性回归方法(linear regression,简称LR)的对比对英国能源局22-30b-11号井声波测井曲线进行了模型重构并基于shapley additive explanations(SHAP)算法对XGBoost模型进行了解释。结果表明,XGBoost在测试集上的决定系数(R2)和均方误差(MSE)分别为0.996,6.371,优于SVR的0.990、15.755和RF的0.993、9.871,而传统多元线性回归方法则为0.969、48.895,表明XGBoost对声波时差曲线的重构具有更高的准确度和更好的泛化性能。创新性地采用SHAP算法对XGBoost黑箱模型的解释表明,在模型构建选择重要特征时,XGBoost模型采用地层温度数据作为特征明显合理于多元线性回归方法采用的井径测井数据。最后基于SHAP对模型进行了单点和全局特征交互解释。上述结果表明在声波测井曲线重构方面,机器学习算法明显优于传统的多元线性回归方法,并证明了SHAP算法在声波测井曲线重构机器学习模型解释方面的可行性,为后续机器学习在测井解释中的发展提供了新的思路。 展开更多
关键词 测井曲线重构 机器学习 模型解释 shap算法 声波测井
在线阅读 下载PDF
基于XGBoost-SHAP的三峡库区生态屏障区生态系统服务权衡及驱动力分析 被引量:1
13
作者 杨佳 斛如媛 +4 位作者 赵海平 勾蒙蒙 欧阳帅 刘常富 肖文发 《水土保持学报》 北大核心 2025年第6期127-138,共12页
[目的]探究三峡库区生态屏障区生态系统服务权衡及其驱动因素,为区域生态系统综合管理和生态安全保障提供科学依据。[方法]基于三峡库区生态屏障区2000-2023年土地利用/覆被数据、气象数据、土壤数据等地理多源数据,运用CASA、RUSLE和In... [目的]探究三峡库区生态屏障区生态系统服务权衡及其驱动因素,为区域生态系统综合管理和生态安全保障提供科学依据。[方法]基于三峡库区生态屏障区2000-2023年土地利用/覆被数据、气象数据、土壤数据等地理多源数据,运用CASA、RUSLE和InVEST等模型系统评估产水服务、碳固存、土壤保持、生境维持和水质净化5种典型生态系统服务,探讨各生态系统服务间权衡与协同关系,并进一步利用XGBoost-SHAP模型揭示生态系统服务权衡关键驱动因子。[结果] 1)产水服务、碳固存和土壤保持服务在2000-2023年呈先下降后增加的趋势,而生境质量、水质净化则呈下降趋势;在空间上,产水服务、生境维持、土壤保持、水质净化高值区主要分布在中部、东部,碳固存则表现为由中部向东西两侧递减。2)5种生态系统服务之间整体以协同关系为主,协同区主要分布在生态屏障区中部及海拔较高、植被覆盖度高的区域,而权衡区主要分布在河流两岸区域、西部的重庆城市区及东部邻近宜昌城区的区域。3)降水增长率、坡度、海拔及植被盖度是决定生态系统服务权衡关系的主要驱动因子,其影响存在阈值效应,而人口密度在一定程度上加剧生态系统服务之间的权衡关系。[结论]在今后生态屏障区的生态修复工程中,应更加关注自然和人为驱动对权衡关系的非线性影响和阈值效应,以更加精准地实现生态系统服务的多功能提升。 展开更多
关键词 生态系统服务 权衡与协同 XGBoost-shap模型 驱动因素 三峡库区生态屏障区
在线阅读 下载PDF
基于特征选择的SHAP-Transformer高炉铁水硅含量预报模型 被引量:4
14
作者 马居安 郑华伟 +4 位作者 刘栋梁 陆昊 周进东 毕学工 熊玮 《钢铁》 北大核心 2025年第8期68-78,共11页
数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal c... 数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal component analysis,PCA)将22个分钟级的特征参数转化为铁次级参数,进一步采用滑动窗口和最大信息系数(maximal information coefficient,Cimax)确定了参数的滞后时长。利用随机森林优化的SHAP算法对34个参数在强耦合条件下的重要性进行评估,筛选出7个关键参数。使用SHAP算法优化Transformer的自注意力机制,构建了SHAP-Transformer铁水硅含量预报模型,通过现场数据验证了模型的有效性。结果表明,铁水硅质量分数预测误差为-0.05~0.05和-0.1~0.1时,基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型的命中率最高,分别为72.12%和95.76%,比基于MIC参数选择的SHAP-Transformer模型提高了26.67%和21.21%,比基于滑动窗口时滞分析及耦合参数优选的长短时记忆网络(long short-term memory,LSTM)模型提高了17.57%和9.7%。基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型对铁水硅含量的变化趋势预测也有较高的精度,趋势方向预测的准确率为87.3%,趋势类别预测的准确率为60.5%,研究能够为高炉操作者提前判断炉温变化提供可靠依据。 展开更多
关键词 高炉 铁水硅含量 特征选择 时滞分析 随机森林 shap算法 炼铁 预报模型
原文传递
基于CatBoost-SHAP模型的建成环境对城市活力影响机制——以西安市主城区为例
15
作者 刘蓓 胡新玲 何浩 《地理与地理信息科学》 北大核心 2025年第6期7-15,共9页
城市活力作为中国城市可持续发展的重要表征,与建成环境之间呈现复杂关系。该文以西安市主城区为研究区,基于百度热力图测度城市活力,并构建“5D”建成环境评价指标体系,运用CatBoost-SHAP模型与GeoVisX空间可视化技术解析建成环境对城... 城市活力作为中国城市可持续发展的重要表征,与建成环境之间呈现复杂关系。该文以西安市主城区为研究区,基于百度热力图测度城市活力,并构建“5D”建成环境评价指标体系,运用CatBoost-SHAP模型与GeoVisX空间可视化技术解析建成环境对城市活力在工作日和休息日的影响机制。结果表明:西安市主城区工作日与休息日城市活力特征不同,工作日呈单峰特征,休息日则表现为双峰特征,整体活力水平高于工作日;建成环境对城市活力的影响呈现明显的空间异质性,中心区域作用显著强于外围区域,但商业设施密度与交通设施密度为持续性关键要素;建成环境因素与城市活力间存在非线性关系及阈值效应,不同建成环境因素间具有协同效应,表明城市活力的形成源于多因子耦合作用。研究结果揭示了建成环境因素对城市活力影响的空间异质性规律、非线性特征以及双指标协同效应,可为提升城市活力提供科学依据。 展开更多
关键词 城市活力 建成环境 CatBoost-shap模型 空间可视化 非线性关系
在线阅读 下载PDF
良性前列腺增生并发膀胱结石的危险因素分析及基于SHAP的可解释性预测模型构建
16
作者 赵欢 欧阳松 +1 位作者 董洪超 王勤章 《现代泌尿外科杂志》 2025年第8期653-661,共9页
目的探讨良性前列腺增生(BPH)患者并发膀胱结石(BS)的独立危险因素,构建预测模型和部署便于使用的网站。方法回顾性分析2022年1月—2025年1月石河子大学第一附属医院泌尿外科收治的460例BPH患者的临床资料,通过单因素逻辑回归结合Borut... 目的探讨良性前列腺增生(BPH)患者并发膀胱结石(BS)的独立危险因素,构建预测模型和部署便于使用的网站。方法回顾性分析2022年1月—2025年1月石河子大学第一附属医院泌尿外科收治的460例BPH患者的临床资料,通过单因素逻辑回归结合Boruta算法共同识别训练集患者中BPH并发BS的独立危险因素,并基于危险因素构建列线图模型。通过受试者工作特征(ROC)曲线、灵敏度、特异度、阳性预测值(PPV)、阴性预测值(NPV)、F1指数、校准曲线和临床决策曲线(DCA)综合评价模型预测效能;使用SHAP算法评估不同变量对BPH并发BS的贡献度。并基于预测模型建立便于使用的网页。结果460例BPH患者中并发BS者144例(31.3%)。单因素逻辑回归结合Boruta算法共识别出中性粒细胞占比、尿培养结果、膀胱内前列腺突出度(IPP)、尿亚硝酸盐检测结果、尿白细胞检测结果和尿潜血结果6个独立危险因素。测试集中,该列线图的ROC曲线下面积为0.887(95%CI:0.816~0.947),灵敏度、特异度、PPV、NPV和F1指数分别为0.705、0.968、0.912、0.876和0.795,校准曲线和DCA均展示出良好的区分能力和临床应用能力。SHAP结果显示IPP、尿白细胞检测结果、尿培养结果、中性粒细胞占比、尿亚硝酸盐检测结果和尿潜血结果是BPH并发BS最重要的危险因素。最终建立可公开访问的BPH并发BS诊断的网站(https://wutiaowu2.shinyapps.io/bladderrrr/)。结论中性粒细胞占比、尿培养结果、IPP、尿亚硝酸盐检测结果、尿白细胞检测结果和尿潜血结果是BPH并发BS的独立影响因素,基于此构建的模型及网页易用且准确度高,具有较高的临床实用价值。 展开更多
关键词 前列腺增生 膀胱结石 列线图 预测模型 shap算法
暂未订购
基于RFECV-XGBoost和SHAP的火电厂电力输灰预测模型
17
作者 刘文新 徐文辉 +4 位作者 陈朝晔 顾海英 温聪 姚雨龙 曾晰 《计算机与现代化》 2025年第4期63-69,共7页
火电厂电力输灰系统输灰产量的准确预测,对于整个火电发电效率的提升具有非常重要的意义。目前火电厂气力输灰系统主要依赖人工经验进行操作,基于此,提出一种基于XGBoost(极端梯度提升)和SHAP(沙普利加法解释)框架的智能输灰预测模型。... 火电厂电力输灰系统输灰产量的准确预测,对于整个火电发电效率的提升具有非常重要的意义。目前火电厂气力输灰系统主要依赖人工经验进行操作,基于此,提出一种基于XGBoost(极端梯度提升)和SHAP(沙普利加法解释)框架的智能输灰预测模型。首先,依托火电厂电力输灰系统的DCS系统,获取空气压力、设备温度等数据信息。其次,为了提升模型预测值准确度和防止过拟合,采用RFECV(交叉验证递归特征消除法)进行特征选择,随后将选择好的特征集导入XGBoost的智能输灰预测模型中,同时采用SHAP模型进行可视化的因果分析,进而从电力输灰数据中发现有用的信息,形成火电厂电力输灰系统的知识库,以达到更加智能高效的运行目标。研究结果可对火电厂输灰预警技术,输灰系统智能化升级方面提供数据支撑,有助于火电厂电力输灰系统节能降耗。 展开更多
关键词 火电厂 输灰预测 XGBoost模型 shap
在线阅读 下载PDF
利用SHAP框架揭示道路网选取中的特征重要性 被引量:3
18
作者 褚天舒 闫浩文 +1 位作者 禄小敏 李蓬勃 《地球信息科学学报》 北大核心 2025年第5期1068-1080,共13页
[目的]城市道路网选取是地图综合领域的重要研究方向之一,其中特征选择是影响选取准确性的关键环节。然而,随着新的特征指标不断提出,如何科学地选择特征成为了一直以来亟待解决的难题。[方法]本文引入了机器学习的可解释性框架—SHaple... [目的]城市道路网选取是地图综合领域的重要研究方向之一,其中特征选择是影响选取准确性的关键环节。然而,随着新的特征指标不断提出,如何科学地选择特征成为了一直以来亟待解决的难题。[方法]本文引入了机器学习的可解释性框架—SHapley加性解释(SHapley Additive exPlanations, SHAP),旨在分析道路网选取中的特征重要性,为特征选择提供新的解决方案。首先,通过文献统计的方式,研究选用了7种常见的特征作为研究对象,并以10个中国典型城市的1:25万和1:100万比例尺道路网数据为基础,构建包含7种特征指标的数据集。随后,利用LightGBM与XGBoost两种监督学习模型进行训练,并通过模型的评价指标对模型性能进行评估。最后,采用SHAP框架对2个模型进行解释,并分析特征间的相似性、作用方向及其重要性。[结果]在特征相似性方面,拓扑特征具有较强的相似性,“周边POI数量”与其他特征的相似性较低。在特征作用方向方面,“周边POI数量”和“交通流量”对模型的影响较为不稳定,而其他特征的高值通常有正向贡献。在特征重要性方面,XGBoost模型显示“等级”是最重要的特征,之后是“长度”和“交通流量”。而LightGBM模型的结果与XGBoost模型类似,表明模型对特征重要性影响较小。研究进一步基于本文的权重结果进行道路网选取,并将结果与标准数据进行对比,实验结果显示选取结果与标准数据有较高的一致性。[结论]本文提出了一种新的解决方案,用于道路网选取中的特征重要性分析,并为特征选择和特征赋权问题提供了参考依据。 展开更多
关键词 地图综合 城市道路网选取 shap框架 特征重要性 监督学习 XGBoost模型 LightGBM模型
原文传递
基于CNN-SHAP的小清河入海总氮通量影响因素分析
19
作者 范志诚 彭辉 王硕 《海洋科学》 北大核心 2025年第7期39-52,共14页
针对我国近海总氮污染问题,提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)和可解释方法SHAP(SHapley Additive exPlanations)的河流入海总氮通量可解释预测模型,模型耦合了马尔科夫链模拟的流域河网拓扑结构,并充分利... 针对我国近海总氮污染问题,提出了一种基于卷积神经网络(Convolutional Neural Network,CNN)和可解释方法SHAP(SHapley Additive exPlanations)的河流入海总氮通量可解释预测模型,模型耦合了马尔科夫链模拟的流域河网拓扑结构,并充分利用多源时空数据。构建的模型应用于小清河,将小清河流域气象、土地利用、土壤类型以及点源和非点源氮排放等多源数据,通过马尔科夫链河网结构,转换为三维输入数据。模型评估显示,三维输入方式的模型在训练集和测试集上都表现出更高的准确性,预测入海通量的相关系数达到了0.99。使用SHAP方法识别了影响模型预测的关键因素,并分析了空间特征对模型预测的影响,揭示了流域不同空间位置对入海总氮通量的影响差异。研究结果不仅提高了入海水质预测的准确性,也为近海环境管理提供了科学依据。 展开更多
关键词 总氮通量预测 CNN模型 shap 深度学习
在线阅读 下载PDF
基于随机森林与SHAP算法的致密砂岩气暂堵效果的影响因素分析
20
作者 黄浩 车恒达 +3 位作者 孔祥伟 辛富斌 向九洲 吉俊杰 《科学技术与工程》 北大核心 2025年第26期11135-11143,共9页
为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂... 为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂堵效果量化模型和公式、暂堵效果算法模型验证,发现暂堵效果量化值与产气贡献率正相关,P=0.037,证明暂堵效果量化模型和公式的准确性高;又因暂堵效果算法模型中,训练集与测试集的MSE、MAE、R^(2)相差微小,证明该模型的泛化能力较强且准确性高。在暂堵效果算法模型的基础之上,开展暂堵效果的影响因素分析,结果表明:总段数、渗透率、暂堵球数量、簇间距和砂比这5个因素对于暂堵效果的影响占比最大。进一步分析单影响因素,发现随总段数增加,暂堵效果增加的规律只适用于直井,对水平井不适用;随渗透率增加,暂堵效果变差;暂堵球数量<50个、簇间距>20 m、砂比介于18%~20%,暂堵效果均可达到正向增长。研究结果可为苏里格等气田现场暂堵作业设计提供借鉴和参考。 展开更多
关键词 苏里格气田 致密砂岩气 暂堵效果 随机森林 shap(shapley additive explanations)值 模型解释
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部