期刊文献+
共找到57篇文章
< 1 2 3 >
每页显示 20 50 100
基于特征工程优化和SHAP解释方法预测圆钢管约束混凝土短柱轴压承载力 被引量:1
1
作者 韦建刚 吴洵桢 +1 位作者 郑裔 杨艳 《东南大学学报(自然科学版)》 北大核心 2025年第5期1328-1336,共9页
以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构... 以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构中常见的9个特征的相关性以及冗余性,从13个机器学习模型中筛选出梯度提升树(GBDT)、随机森林(Random Forest)、极端梯度提升(XGBoost)和极端随机树(Extra Trees)四个最优模型对STCC的极限轴压承载力N_(u)进行预测,并采用SHAP可解释方法对4种模型进行可视化对比分析。研究表明:截面含钢率α在统计分析中方差趋于零且与径厚比B/t呈完全负相关关系;约束效应系数ζ在F检验中与N_(u)的显著性水平小于5%,斯皮尔曼、皮尔森以及互信息量相关性分析均表明其与N_(u)弱相关。通过SHAP方法对上述4种模型可视化发现,XGBoost在测试集上的表现尤为突出,其决定系数R^(2)(0.9626)、均方根误差(287.40 kN)、平均绝对误差(139.13 kN)以及平均绝对百分比误差(5.1%)均为4个模型中的最低值。此外,XGBoost在泛化能力和避免过拟合方面也表现出色,因此更适用于STCC短柱轴压承载力预测。 展开更多
关键词 机器学习 特征工程 shap解释方法 圆钢管约束混凝土 轴压承载力 特征重要性分析
在线阅读 下载PDF
采用SHAP的高压涡轮级高维设计空间数据挖掘
2
作者 杨昭 郭振东 +2 位作者 苏鹏飞 汪祺能 宋立明 《西安交通大学学报》 北大核心 2025年第6期144-154,共11页
为厘清涡轮级高维设计空间中各变量对级性能的影响,基于数据挖掘方法SHAP对GE-E3高压涡轮第一级的93个设计变量进行了知识挖掘。除常规数据挖掘工作中显著变量对总体性能的影响分析外,发展了显著变量对涡轮级沿叶高方向性能分布影响的... 为厘清涡轮级高维设计空间中各变量对级性能的影响,基于数据挖掘方法SHAP对GE-E3高压涡轮第一级的93个设计变量进行了知识挖掘。除常规数据挖掘工作中显著变量对总体性能的影响分析外,发展了显著变量对涡轮级沿叶高方向性能分布影响的分析方法,可视化表示了改善级总体性能的设计变量所影响的涡轮级的具体位置;同时,充分发挥SHAP局部解释的优势,在设计空间中选取典型样本进行归因分析,研究了各设计变量在样本性能指标变化中所发挥的作用。研究发现,对于高压涡轮级,影响级效率的显著变量包括有效出气角、静叶三维积叠参数、叶片吸力面前缘附近样条控制点等。基于GE-E3高压涡轮数据集进行数据挖掘归纳得到涡轮级设计准则:减小动叶中间截面有效出气角、增大静叶中间截面有效出气角,静叶三维积叠点周向顶部位置、周向中间位置向压力面偏移,静叶中间截面、动叶中间截面吸力面前缘附近控制点均向叶片变薄方向移动。遵循设计准则得到的最终设计使级效率提高了0.65%。 展开更多
关键词 高压涡轮级 高维设计空间 数据挖掘 shap方法
在线阅读 下载PDF
基于XGBoost-SHAP方法的陕西省PM_(2.5)影响因素分析 被引量:7
3
作者 赵兴赟 张强 +4 位作者 杨方社 郑烈龙 罗嘉昕 史治辉 问思路 《环境科学研究》 北大核心 2025年第5期990-999,共10页
陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气... 陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气污染物数据集,对陕西省PM_(2.5)浓度的时空变化特征进行研究,通过构建XGBoost模型并结合SHAP方法,分析陕西省PM_(2.5)浓度与气象、地形及植被因素和社会经济因素的关系,阐明各因素对PM_(2.5)浓度的时空影响。结果表明:①时间上,2013−2022年陕西省PM_(2.5)浓度整体呈现下降趋势,年均浓度最大值(56.02μg/m^(3))出现在2013年,在2019−2022年PM_(2.5)年均浓度低于《环境空气质量标准》(GB 3095−2012)二级标准限值(35μg/m^(3));空间上,陕西省呈现“关中高、陕南和陕北低”的污染空间格局。②在所研究的影响因素中,XGBoost-SHAP方法揭示了影响陕西省PM_(2.5)浓度的主要因素依次为高程、相对湿度、温度和人口密度,其中,高程和相对湿度对陕西省PM_(2.5)浓度具有负向影响,而温度和人口密度则表现为正向影响。③通过划分影响区发现,陕北、关中及陕南地区PM_(2.5)主要影响因素的作用方向与影响强度存在显著的空间异质性。研究显示,2013−2022年陕西省PM_(2.5)浓度大幅下降,PM_(2.5)的主要影响因素在不同区域存在空间差异,治理PM_(2.5)污染需要综合考虑区域异质性与多重影响因素的协同作用。 展开更多
关键词 PM_(2.5) XGBoost模型 shap方法 时空特征 影响因素
在线阅读 下载PDF
基于XGBoost-SHAP的预后营养指数和椎动脉阻力指数对老年轻型缺血性脑卒中患者衰弱预测模型的影响 被引量:1
4
作者 乔丽敏 赵雅宁 +3 位作者 刘瑶 赵旭 史雪菲 王明慧 《中国慢性病预防与控制》 北大核心 2025年第5期357-362,共6页
目的探讨预后营养指数(PNI)和椎动脉阻力指数(RI)对改善老年轻型缺血性脑卒中患者衰弱预测模型性能及预测能力的影响,为老年轻型缺血性脑卒中患者衰弱防治提供科学依据。方法选取2022年10月至2023年9月在华北理工大学附属医院诊治的826... 目的探讨预后营养指数(PNI)和椎动脉阻力指数(RI)对改善老年轻型缺血性脑卒中患者衰弱预测模型性能及预测能力的影响,为老年轻型缺血性脑卒中患者衰弱防治提供科学依据。方法选取2022年10月至2023年9月在华北理工大学附属医院诊治的826例老年轻型缺血性脑卒中患者为研究对象,根据出院后3个月随访是否发生衰弱分为衰弱组(220例)和无衰弱组(606例)。使用SPSS 25.0进行单因素分析及多因素logistic回归分析。采用Python 3.9.0中XGBoost机器学习算法建模,建立经典预测模型和包含PNI、RI的预测模型,通过受试者工作特征曲线下面积、准确率、灵敏度、特异度和F1分数等对模型性能进行综合评价,比较不同模型之间的差别。引入SHAP对模型进行可解释化处理。结果826例老年轻型缺血性脑卒中患者中,220例发生衰弱,占26.6%。多因素logistic回归分析显示,年龄(OR=2.697,95%CI:1.852~3.930)、脑白质中重度病变(OR=1.999,95%CI:1.356~2.947)、卒中发作次数≥2次(OR=1.949,95%CI:1.348~2.817)、共病≥2种(OR=2.134,95%CI:1.472~3.094)、RI>0.67(OR=1.689,95%CI:1.178~2.423)、PNI≤46.3(OR=2.485,95%CI:1.695~3.644)与老年轻型缺血性脑卒中患者衰弱高风险相关,中高水平体力活动(OR=0.529,95%CI:0.358~0.782)与老年轻型缺血性脑卒中患者衰弱低风险相关(P<0.05)。XGBoost建立的包含年龄、脑白质病变(WML)、卒中发作次数、共病及体力活动影响因子的经典预测模型和在此基础上加入RI、PNI以及两者联合的预测模型的受试者工作特征曲线下面积分别为0.767、0.787、0.774和0.807,准确率分别为0.741、0.770、0.758和0.810,灵敏度分别为0.865、0.880、0.859和0.842,特异度分别为0.538、0.578、0.565和0.784,F1分数分别为0.609、0.645、0.615和0.818。基于SHAP的XGBoost可解释模型特征重要度排名依次为年龄、PNI、共病、WML、体力活动、RI、卒中发作次数,整体可解释性分析结果显示年龄>70岁、PNI≤46.3、共病≥2种、脑白质中重度病变、RI>0.67、卒中发作次数≥2次对模型有正向影响,老年轻型缺血性脑卒中患者发生衰弱风险较高。中高体力活动水平对模型有负向影响,老年轻型缺血性脑卒中患者衰弱发生风险较低。结论PNI和RI提升了老年轻型缺血性脑卒中患者衰弱预测模型的性能和预测能力。 展开更多
关键词 缺血性脑卒中 衰弱 机器学习 shap方法 巢式病例对照研究
原文传递
基于SHAP-GA-XGBoost融合模型的北京公路货运量预测研究
5
作者 安海岗 孙晓蕾 《物流科技》 2025年第22期93-99,共7页
在北京市公路货运系统日益复杂且对城市经济与物流运转至关重要的背景下,精准预测北京市公路货运量,可为政府交通规划、能源结构调整及应急响应提供科学依据。因此,文章构建SHAP-GA-XGBoost融合模型以更精准的预测北京市公路货运量。首... 在北京市公路货运系统日益复杂且对城市经济与物流运转至关重要的背景下,精准预测北京市公路货运量,可为政府交通规划、能源结构调整及应急响应提供科学依据。因此,文章构建SHAP-GA-XGBoost融合模型以更精准的预测北京市公路货运量。首先,基于需求驱动、供给能力等五大维度,筛选出24个影响北京市公路货运量的初始指标,并使用混频数据模型与KNN反距离权重插值完成数据预处理;其次,利用SHAP值与沃德法筛选出15个关键特征变量,降低模型输入维度;最后,引入Halton低差异序列优化遗传算法初始种群分布,并利用遗传算法实现XGBoost模型的超参寻优。实证结果表明,SHAP-GA-XGBoost融合模型在E_(MAE)、E_(MAPE)等指标上显著优于BP、SVM、LSTM、LSSVM等对比模型,验证了特征工程与算法优化协同的有效性。 展开更多
关键词 shap方法 遗传算法 极限梯度提升模型 公路货运量
在线阅读 下载PDF
基于XGBoost与SHAP分析的可解释性故障诊断方法研究
6
作者 李开平 张凤丽 +1 位作者 黄祖广 王金江 《制造技术与机床》 北大核心 2025年第6期199-208,共10页
针对现有智能故障诊断方法存在特征输入单一、故障难以提取、模型可解释性较差等问题,提出一种基于XGBoost(extreme gradient boosting)与SHAP(SHapley Additive exPlanations)分析的可解释性故障诊断方法。首先,采用传统信号处理方法... 针对现有智能故障诊断方法存在特征输入单一、故障难以提取、模型可解释性较差等问题,提出一种基于XGBoost(extreme gradient boosting)与SHAP(SHapley Additive exPlanations)分析的可解释性故障诊断方法。首先,采用传统信号处理方法完成多域特征的提取。其次,基于XGBoost集成算法构建故障诊断模型,并根据XGBoost内嵌评估指标对模型进行初步特征解释。最后,运用Tree SHAP方法对诊断模型进行特征解释分析,探究重要特征对轴承故障类别趋势的影响关系,分析特征之间的依赖交互效应,直观、透明地揭示模型的诊断机制。通过实验对比XGBoost与其他传统机器学习方法,本模型在多维评价指标中综合表现更为突出,且具有较强的精确性,故障诊断准确率高达99.62%,具备良好的实际应用价值。 展开更多
关键词 可解释性故障诊断方法 多域特征 XGBoost集成算法 Tree shap 特征解释
在线阅读 下载PDF
Shapley值及其应用 被引量:2
7
作者 吴孟达 毛紫阳 王丹 《数学建模及其应用》 2024年第1期110-119,共10页
Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4... Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4个方面介绍了Shapley值的应用进展. 展开更多
关键词 合作博弈 shapLEY值 权力指数 图博弈 shap方法
在线阅读 下载PDF
基于连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演 被引量:17
8
作者 叶淼 朱琳 +3 位作者 刘旭东 黄勇 陈蓓蓓 李欢 《环境科学》 EI CAS CSCD 北大核心 2024年第4期2280-2291,共12页
针对土壤有机质含量高光谱反演中存在的光谱有效信号薄弱和光谱信息冗余问题,提出结合连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演框架.以北京市延庆区和房山区永久基本农田土壤为研究对象,首先,基于连续小波变换处理的土... 针对土壤有机质含量高光谱反演中存在的光谱有效信号薄弱和光谱信息冗余问题,提出结合连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演框架.以北京市延庆区和房山区永久基本农田土壤为研究对象,首先,基于连续小波变换处理的土壤光谱反射率数据构建初始XGBoost模型;然后,利用SHAP方法分析模型中各波段的贡献度以筛选特征波段;最后,基于特征波段重新构建和优化XGBoost模型,实现土壤有机质含量高光谱反演.发现连续小波变换尺度为25时,利用SHAP方法选取的40个特征波段构建的XGBoost模型准确性最高,有机质含量反演值和实测值之间的R~2为0.80,RMSE为3.60g·kg^(-1);随着连续小波变换尺度的增大,R2呈现先升高后降低的趋势,25尺度下的R2比21尺度的高0.37;SHAP方法选取的特征波段比Pearson相关分析法少682个,RMSE低0.69 g·kg^(-1);XGBoost模型的R2分别比随机森林和支持向量机模型高4%和8%.验证了结合连续小波变换、SHAP和XGBoost在土壤有机质含量高光谱反演中的有效性,为快速、准确监测土壤有机质含量提供技术支撑. 展开更多
关键词 土壤有机质(SOM) 高光谱反演 连续小波变换 shap方法 XGBoost模型
原文传递
融合随机森林和SHAP方法的灌区用水调度经验分析--以淠史杭灌区瓦西干渠灌域为例 被引量:2
9
作者 苏楠 章少辉 +1 位作者 白美健 张宝忠 《灌溉排水学报》 CAS CSCD 北大核心 2022年第11期122-128,共7页
【目的】定量表征灌区积累丰富的用水调度经验,使其能够被其他管理人员复制和应用。【方法】本文基于淠史杭灌区瓦西干渠灌域的3个典型年实测数据样本,在充分考虑温度、降雨和土壤墒情等特征变量的空间变异基础上,通过融合随机森林模型... 【目的】定量表征灌区积累丰富的用水调度经验,使其能够被其他管理人员复制和应用。【方法】本文基于淠史杭灌区瓦西干渠灌域的3个典型年实测数据样本,在充分考虑温度、降雨和土壤墒情等特征变量的空间变异基础上,通过融合随机森林模型和SHAP方法,构建有限数据样本下灌区用水调度目标流量与各特征变量之间的非线性定量表征。【结果】应用该方法可得到长时间序列以及不同典型年情境下各特征变量的重要性得分及变化情况,在找到适用于实际用水调度特征变量组合的同时,可分析得到不同调度情景下主要参考的特征变量指标;结合SHAP值正负情况分析,还可得到用水调度目标流量对各特征变量响应的正负方向。【结论】本文所用方法实现了灌区用水调度历史经验的定量知识化表征,为理性预测未来不同用水调度流量提供科学依据。 展开更多
关键词 淠史杭灌区 用水调度 随机森林模型 shap方法 特征变量 非线性表征
在线阅读 下载PDF
基于CatBoost模型和SHAP解释方法的土壤重金属影响因素与程度定量分析 被引量:14
10
作者 郑家桐 王鹏 +3 位作者 石航源 肖荣波 邓一荣 庄长伟 《环境科学学报》 CAS CSCD 北大核心 2023年第4期448-456,共9页
掌握土壤重金属空间特征及定量解析污染源对于精准治污具有重要支撑作用,但定量分析影响因子的贡献和影响程度面临巨大挑战.本文选取空间位置、地形地貌、土壤特征三大类16个影响因素,采用CatBoost-SHAP耦合模型定量评估了土壤重金属空... 掌握土壤重金属空间特征及定量解析污染源对于精准治污具有重要支撑作用,但定量分析影响因子的贡献和影响程度面临巨大挑战.本文选取空间位置、地形地貌、土壤特征三大类16个影响因素,采用CatBoost-SHAP耦合模型定量评估了土壤重金属空间分布的影响因子和范围边界.结果表明,CatBoost在预测土壤Cd、Pb和Cr含量上具有较高精度,R^(2)分别为0.76、0.71和0.81.空间位置对土壤Cd、Pb分布的影响分别可达71.28%和73.54%,其中,与冶炼厂的距离(DI_(Smp))是土壤Cd空间分布的关键影响因素,影响范围在7.5 km内;与二级公路的距离(DR_(Sec))是土壤Pb空间分布的关键影响因素,影响范围可达8 km;Fe_(2)O_(3)是土壤Cr空间分布的关键影响因素,土壤中氧化铁含量达到4.5%后开始正向影响土壤Cr含量.本研究定量解析了土壤重金属影响因素,可为土壤重金属污染防治提供科学决策依据. 展开更多
关键词 重金属 空间分布 CatBoost模型 shap解释方法 可解释性 影响因素
原文传递
走滑断层作用下管道应变峰值预测方法
11
作者 施宁 付孟楷 +5 位作者 余佳莹 邵佳 白路遥 陈朋超 刘啸奔 张宏 《油气储运》 北大核心 2025年第12期1395-1402,共8页
【目的】走滑断层是埋地管道常见地质灾害类型之一,断层作用往往使管道发生局部大形变而失效,严重威胁管网系统的结构安全,亟需快速、准确地预测走滑断层作用下管道的应变峰值。【方法】基于可分离式残差神经网络(Separable Residual Ne... 【目的】走滑断层是埋地管道常见地质灾害类型之一,断层作用往往使管道发生局部大形变而失效,严重威胁管网系统的结构安全,亟需快速、准确地预测走滑断层作用下管道的应变峰值。【方法】基于可分离式残差神经网络(Separable Residual Neural Network,S-ResNet)模型,构建走滑断层作用下管道应变峰值预测模型:为兼顾计算准确性与计算效率,通过管壳单元耦合建立参数化走滑断层作用下管道有限元模型;计算不同管径、壁厚、运行压力、走滑断层位移、土壤参数多因素影响下管道的力学响应,并建立走滑断层作用下的管道应变峰值数据库;将可分离式自注意力机制与残差神经网络模型相融合,利用S-ResNet建立走滑断层作用下管道应变峰值预测模型;采用SHAP(SHapley Additive exPlanation)分析法对所建模型进行全局解释与局部解释分析,得到管道拉应变、压应变峰值预测的关键影响因素。【结果】以多种工况下有限元模型计算结果为参考值,将新建模型与常用机器学习模型的模拟结果进行对比表明,基于S-ResNet的走滑断层作用下管道应变峰值预测模型具有更高的准确性:当预测管道拉应变峰值时,新建模型测试集的决定系数R2为0.99961、均方误差(Mean Square Error,MSE)为3.56×10-8、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)为1.751%;当预测管道压应变峰值时,模型测试集的R2、MSE、MAPE分别为0.99872、2.65×10-7、3.225%。在可解释性分析方面,SHAP分析结果表明,走滑断层作用下的管道应变峰值主要受走滑断层位移、侧向土弹簧极限抗力、管道壁厚、穿越角的影响较大。【结论】基于S-ResNet与SHAP分析法的管道应变峰值预测模型能够快速、精确、可解释地预测走滑断层作用下管道的力学响应,不仅为断层区管道安全评价提供了准确、高效的预测方法,也可为地质灾害段管道数字孪生提供参考。(图7,表2,参22) 展开更多
关键词 埋地管道 走滑断层作用 应变峰值 S-ResNet模型 深度学习 shap分析法
原文传递
基于深度学习的重质馏分油分子层次组成预测模型 被引量:1
12
作者 袁壮 王源 +6 位作者 杨哲 徐伟 周鑫 赵辉 陈小博 杨朝合 林扬 《石油学报(石油加工)》 北大核心 2025年第2期362-370,共9页
随着工业大数据时代的到来,基于深度学习建立的原油分子组成预测模型具有适用范围广、构建快捷、准确性高等优点。然而,石油馏分分子层次信息标签获取困难,难以满足深度学习模型训练需求。为解决上述问题,基于商业流程模拟软件Aspen HY... 随着工业大数据时代的到来,基于深度学习建立的原油分子组成预测模型具有适用范围广、构建快捷、准确性高等优点。然而,石油馏分分子层次信息标签获取困难,难以满足深度学习模型训练需求。为解决上述问题,基于商业流程模拟软件Aspen HYSYS与GC-MS×MS全二维气相色谱-飞行时间质谱联用仪提出了一种创新方法,建立足够规模的训练数据库。采用深度神经网络(DNN)建立了重质馏分油分子层次结构组成预测模型,该模型以炼油厂易测得的油品物理化学性质为输入,分子层次结构信息为输出,针对某炼油厂的催化裂化原料油进行分子组成预测,通过SHAP(SHapley Additive exPlanation)方法对模型进行可解释分析。结果表明,基于深度学习的重质馏分油分子组成预测模型能够准确地预测油品分子层次结构信息,目标装置原料分子组成预测平均相对误差小于8%。该模型不仅可对其他炼化装置的原料油性质进行软测量,也可为石油分子层次模型的开发提供准确的重油原料分子信息模型。 展开更多
关键词 重质馏分油 分子组成 深度学习 shapley Additive exPlanation(shap)解释 分子管理
在线阅读 下载PDF
基于LSTM神经网络的核电厂瞬态参数预测与故障诊断研究 被引量:2
13
作者 刘涛 谢金森 《核动力工程》 北大核心 2025年第2期230-238,共9页
为提高核电厂瞬态工况下参数预测和故障诊断的准确性和实时性,本研究采用长短期记忆(LSTM)神经网络模型进行预测和诊断。通过生成并随机化故障情景,减少预测模型对特定模式的依赖,提高其在未知故障情景下的泛化能力。研究结合沙普利加... 为提高核电厂瞬态工况下参数预测和故障诊断的准确性和实时性,本研究采用长短期记忆(LSTM)神经网络模型进行预测和诊断。通过生成并随机化故障情景,减少预测模型对特定模式的依赖,提高其在未知故障情景下的泛化能力。研究结合沙普利加性解释性(SHAP)方法,对预测模型的参数预测结果进行解释性分析,评估不同输入特征对模型预测性能的影响,并验证该预测模型在传感器故障和数据传输错误情况下的预测准确性。此外,针对含有不同噪声水平的瞬态参数进行故障诊断,验证故障诊断模型的鲁棒性。结果表明,LSTM神经网络模型在预测和诊断方面具有较高的精度,即使在传感器故障、数据传输有误以及数据含有噪声情况下仍表现出色。本研究提出的方法能够提升核电厂运行安全和稳定性,为事故工况下的安全性提供有效技术支持。 展开更多
关键词 核电厂 瞬态参数预测 故障诊断 LSTM神经网络 沙普利加性解释性(shap)方法
原文传递
解释纠偏框架:一种基于标准解释的归因分数生成方法
14
作者 邢钟毓 梁嘉旋 +3 位作者 余国先 王峻 郭茂祖 崔立真 《计算机学报》 北大核心 2025年第4期949-970,共22页
模型可解释性研究面临一个关键挑战:对于同一数据集,不同模型尽管能达到相似的预测性能,但受训练过程中随机因素等变量影响,其输入特征的重要性评分(归因分数解释)存在显著不一致,这降低了解释的可信度。针对此问题,本文首先从理论上探... 模型可解释性研究面临一个关键挑战:对于同一数据集,不同模型尽管能达到相似的预测性能,但受训练过程中随机因素等变量影响,其输入特征的重要性评分(归因分数解释)存在显著不一致,这降低了解释的可信度。针对此问题,本文首先从理论上探讨了解释不一致与模型不确定性因素之间的联系,证明了归因解释中的SHAP(SHapley Additive exPlanation)方法在相似预测模型中的不确定性上界。在此基础上,我们通过实验深入研究了模型集合中模型训练随机因素等变量对特征归因方法的影响,发现模型不确定导致的解释不确定性普遍存在,而SHAP方法由于其上界的影响不确定性较低。据此,我们提出了一种基于不同模型的标准解释生成稳定归因分数解释的纠偏框架ASGM(Attribution Score Generation Method),以减少归因分数解释的不一致,提升模型解释的稳定性和可信度。该框架通过检测少量抽样模型解释与大量模型生成标准解释之间的差异,利用校正偏差的深度学习模型,生成代表规格不足集或罗生门效应集的归因分数解释,并能预测规格不足集解释间的不确定性。实验结果表明,ASGM可以生成受模型(尤其是随机因素)影响较小的解释,生成解释的质量高于对模型集合解释排名的均值,接近标准解释。此外,与标准解释相比,ASGM在罗生门效应集上的计算时间减少了20%~30%,在规格不足集上减少了17%~48%,这些结果验证了ASGM可有效提升解释稳定性和可信度。 展开更多
关键词 模型不确定性 可解释人工智能 规格不足集 罗生门效应集 shap方法
在线阅读 下载PDF
农业新质生产力对粮食供应链韧性的影响效应
15
作者 魏峰 李美慧 《现代农业》 2025年第6期17-32,共16页
持续推进农业新质生产力发展是提升粮食供应链韧性的重要路径。文章基于2014—2023年我国31个省区市(除港澳台地区)的面板数据,运用纵横向拉开档次法对粮食供应链韧性进行量化评估,结合Kernel密度估计、传统及空间马尔可夫链、基尼系数... 持续推进农业新质生产力发展是提升粮食供应链韧性的重要路径。文章基于2014—2023年我国31个省区市(除港澳台地区)的面板数据,运用纵横向拉开档次法对粮食供应链韧性进行量化评估,结合Kernel密度估计、传统及空间马尔可夫链、基尼系数剖析其时空分异与区域差异,对比7类机器学习模型,采用最优的支持向量回归(SVR)模型,并与SHAP解释器结合,揭示农业新质生产力对粮食供应链韧性的驱动效应。结果表明:我国粮食供应链韧性逐年攀升,并保持粮食主产区>产销平衡区>粮食主销区的格局,空间分布呈现“中间层级扩容、两端层级减少”的特征;区域差异逐年缩小但多极化现象仍存,组间差异贡献率波动上升并成为粮食供应链韧性差异的主要来源;农林牧渔服务业产值、城镇化率和农业碳排放起正向驱动作用,农业劳动力流动起负向抑制作用,其他驱动因素的贡献率相对较低;驱动因素间的交互作用对粮食供应链韧性产生较大影响。据此,应通过实施区域差异化精准提升策略、构建粮食供应韧性支撑体系,促进农业新质生产力提升粮食供应链整体韧性。 展开更多
关键词 农业新质生产力 粮食供应链韧性 纵横向拉开档次法 SVR模型 shap解释器
在线阅读 下载PDF
考虑车辆运动状态信息特性的自由换道意图识别模型
16
作者 辛琪 王彦锋 +2 位作者 王智龙 王畅 牛世峰 《交通运输系统工程与信息》 北大核心 2025年第6期74-86,共13页
为实现自由换道场景下驾驶人换道意图的准确识别,通过分析换道过程中车辆运动状态的信息变化规律,提出一种考虑车辆运动状态信息特性的自由换道意图识别模型。首先,基于人机共驾实车系统平台采集驾驶人自由换道场景下的车辆运动状态信息... 为实现自由换道场景下驾驶人换道意图的准确识别,通过分析换道过程中车辆运动状态的信息变化规律,提出一种考虑车辆运动状态信息特性的自由换道意图识别模型。首先,基于人机共驾实车系统平台采集驾驶人自由换道场景下的车辆运动状态信息,通过车道线检测获取车辆中心点与车道中心线的偏离距离,确定自由换道过程关键时间节点,将所采集数据分成车道保持、向左换道和向右换道3类,构建换道意图数据集;其次,通过SHAP(SHapley Additive exPlanations)全局可解释性方法分析各车辆运动状态信息对换道意图识别的影响权重,并采用独立样本T检验说明各变量的差异性,验证各变量作为换道意图识别模型输入的可行性;再次,针对自由换道过程中车辆运动状态的非平稳性、采样吉布斯现象及车道偏离数据干扰问题,在Informer网络的基础上依次引入可逆实例归一化模块(RevIN)、频率增强信道注意力机制(FECAM)、趋势感知自注意力机制(ETTA)和Unet结构,构建自由换道意图识别模型RF-EUInformer(RevIN FECAM-ETTA Unet Informer);最后,采用蒙特卡洛交叉验证评估模型的泛化能力,通过消融试验得出引入的各模块在1.5 s预判时间下对准确率的贡献分别为1.4%、0.5%、0.6%和1.2%,验证了各模块的有效性。与双向长短期记忆网络(Bi-LSTM)、卷积长短期记忆网络(ConvLSTM)、时域卷积网络(TCN)和时域卷积网络-注意力机制(TCN-Attention)等模型进行对比分析,所提出模型在0.5、1.0、1.5 s预判时间下的准确率较最优对比模型分别提升了3.9%、4.5%和5.8%。 展开更多
关键词 智能交通 自由换道意图识别 INFORMER 车辆运动状态信息 shap方法
在线阅读 下载PDF
基于机器学习的±800 kV干式平波电抗器震后状态评估方法
17
作者 叶芳怡 刘匀 +1 位作者 朱旺 谢强 《高压电器》 北大核心 2025年第4期1-11,共11页
为实现电气设备的震后状态快速评估,以保障电力系统的应急决策与灾后恢复顺利进行,文中提出一种基于机器学习的评估方法。以±800 kV干式平波电抗器为研究对象,建立Abaqus有限元模型进行地震响应分析确定其抗震薄弱环节。向有限元... 为实现电气设备的震后状态快速评估,以保障电力系统的应急决策与灾后恢复顺利进行,文中提出一种基于机器学习的评估方法。以±800 kV干式平波电抗器为研究对象,建立Abaqus有限元模型进行地震响应分析确定其抗震薄弱环节。向有限元模型中输入大量地震波计算获得用于建立评估模型所需的机器学习数据集,采取相关性分析法剔除冗余特征,选取不同机器学习算法比较其评估性能,并通过SHAP(shapley additive explanations)解释评估模型,以此避免机器学习模型的“黑箱”特性。结果表明:平波电抗器的抗震薄弱环节为支撑绝缘子根部应力响应;基于XGBoost算法架构的评估模型具有最优性能;SHAP法可从全局和局部层面揭示地震动参数对设备震后状态的影响。基于机器学习算法建立的评估模型能够快速准确地评估设备震后状态,可为变电站或换流站整站的智能化防灾系统建立提供技术支撑。 展开更多
关键词 ±800 kV干式平波电抗器 震后评估 机器学习 shap
在线阅读 下载PDF
珠江三角洲地区用水量影响要素及其关联规则
18
作者 郑炎辉 徐小迪 +2 位作者 李俊辉 林树彦 何艳虎 《中山大学学报(自然科学版)(中英文)》 北大核心 2025年第2期22-32,共11页
区域用水量影响要素及其关联规则识别对于合理预测用水需求和优化配置水资源具有重要意义。本文基于珠三角地区历年水资源开发利用数据和经济社会发展统计数据,利用随机森林(RF,random forest)和人工神经网络(ANN,artificial neural net... 区域用水量影响要素及其关联规则识别对于合理预测用水需求和优化配置水资源具有重要意义。本文基于珠三角地区历年水资源开发利用数据和经济社会发展统计数据,利用随机森林(RF,random forest)和人工神经网络(ANN,artificial neural network)两种机器学习模型,并综合采用SHAP(shapley additive explanations)和部分依赖图(PDP,partial dependence plots)方法,系统识别了珠三角地区用水量影响要素及其与用水量的关联规则,揭示了各影响要素贡献度的时空变化特征。结果表明:用水量影响要素按重要度排序依次是GDP、人口规模、耕地面积、人均水资源量、农田实灌单位面积平均用水量、城镇人均生活用水量;ANN模型和RF模型决定系数平均值分别在0.94和0.92以上;用水量影响要素空间上呈现中心城市以人口为主导、周边地区以耕地面积为主导的特点;珠三角地区用水量对于人口规模和耕地面积变化的响应最为明显。研究可为珠三角地区未来用水需求预测以及水资源空间均衡配置提供科学依据与技术支撑。 展开更多
关键词 人工神经网络 随机森林 用水量 shap方法 PDP
在线阅读 下载PDF
长三角地区绿色低碳发展的时空演变及其驱动因素分析
19
作者 陈友 谭本艳 郭颖珠 《环境科学研究》 北大核心 2025年第10期2136-2146,共11页
在“双碳”目标背景下,长三角作为我国经济最活跃地区,其绿色低碳转型对全国可持续发展具有示范意义。本文以长三角地区为研究对象,构建绿色低碳发展评价体系,探讨其绿色低碳发展的时空演变特征,并通过XGBoost机器学习算法及SHAP可解释... 在“双碳”目标背景下,长三角作为我国经济最活跃地区,其绿色低碳转型对全国可持续发展具有示范意义。本文以长三角地区为研究对象,构建绿色低碳发展评价体系,探讨其绿色低碳发展的时空演变特征,并通过XGBoost机器学习算法及SHAP可解释性分析识别其核心驱动因素及交互影响。结果表明:①长三角地区绿色低碳发展水平呈现上升趋势,但区域发展不平衡。②长三角地区绿色低碳发展存在局部空间自相关,部分城市有“高-高”集聚和“低-低”集聚特征。③环保卫生投资、电车数量、绿色发明专利、绿地面积、二氧化硫排放量、二氧化碳排放量是影响绿色低碳发展排名前六的驱动因素,其中前四位促进绿色低碳发展,后两位起抑制作用。④在高碳排放背景下,推广公交电车出行和绿色技术创新对改善绿色低碳水平的边际效应更为明显。研究显示,长三角地区未来绿色低碳发展水平的提升需依托区域协同治理及产业绿色升级。因此,应结合区域实际情况,强化区域间协同合作,增加环保投资力度,拓展新能源电车应用优势,推动绿色技术创新,并调整高能耗产业结构,以此促进长三角及全国绿色低碳转型实现高质量发展。 展开更多
关键词 绿色低碳发展 长三角地区 XGBoost算法 shap方法
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部