期刊文献+
共找到52篇文章
< 1 2 3 >
每页显示 20 50 100
基于特征工程优化和SHAP解释方法预测圆钢管约束混凝土短柱轴压承载力 被引量:1
1
作者 韦建刚 吴洵桢 +1 位作者 郑裔 杨艳 《东南大学学报(自然科学版)》 北大核心 2025年第5期1328-1336,共9页
以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构... 以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构中常见的9个特征的相关性以及冗余性,从13个机器学习模型中筛选出梯度提升树(GBDT)、随机森林(Random Forest)、极端梯度提升(XGBoost)和极端随机树(Extra Trees)四个最优模型对STCC的极限轴压承载力N_(u)进行预测,并采用SHAP可解释方法对4种模型进行可视化对比分析。研究表明:截面含钢率α在统计分析中方差趋于零且与径厚比B/t呈完全负相关关系;约束效应系数ζ在F检验中与N_(u)的显著性水平小于5%,斯皮尔曼、皮尔森以及互信息量相关性分析均表明其与N_(u)弱相关。通过SHAP方法对上述4种模型可视化发现,XGBoost在测试集上的表现尤为突出,其决定系数R^(2)(0.9626)、均方根误差(287.40 kN)、平均绝对误差(139.13 kN)以及平均绝对百分比误差(5.1%)均为4个模型中的最低值。此外,XGBoost在泛化能力和避免过拟合方面也表现出色,因此更适用于STCC短柱轴压承载力预测。 展开更多
关键词 机器学习 特征工程 shap解释方法 圆钢管约束混凝土 轴压承载力 特征重要性分析
在线阅读 下载PDF
采用SHAP的高压涡轮级高维设计空间数据挖掘
2
作者 杨昭 郭振东 +2 位作者 苏鹏飞 汪祺能 宋立明 《西安交通大学学报》 北大核心 2025年第6期144-154,共11页
为厘清涡轮级高维设计空间中各变量对级性能的影响,基于数据挖掘方法SHAP对GE-E3高压涡轮第一级的93个设计变量进行了知识挖掘。除常规数据挖掘工作中显著变量对总体性能的影响分析外,发展了显著变量对涡轮级沿叶高方向性能分布影响的... 为厘清涡轮级高维设计空间中各变量对级性能的影响,基于数据挖掘方法SHAP对GE-E3高压涡轮第一级的93个设计变量进行了知识挖掘。除常规数据挖掘工作中显著变量对总体性能的影响分析外,发展了显著变量对涡轮级沿叶高方向性能分布影响的分析方法,可视化表示了改善级总体性能的设计变量所影响的涡轮级的具体位置;同时,充分发挥SHAP局部解释的优势,在设计空间中选取典型样本进行归因分析,研究了各设计变量在样本性能指标变化中所发挥的作用。研究发现,对于高压涡轮级,影响级效率的显著变量包括有效出气角、静叶三维积叠参数、叶片吸力面前缘附近样条控制点等。基于GE-E3高压涡轮数据集进行数据挖掘归纳得到涡轮级设计准则:减小动叶中间截面有效出气角、增大静叶中间截面有效出气角,静叶三维积叠点周向顶部位置、周向中间位置向压力面偏移,静叶中间截面、动叶中间截面吸力面前缘附近控制点均向叶片变薄方向移动。遵循设计准则得到的最终设计使级效率提高了0.65%。 展开更多
关键词 高压涡轮级 高维设计空间 数据挖掘 shap方法
在线阅读 下载PDF
基于XGBoost-SHAP方法的陕西省PM_(2.5)影响因素分析 被引量:4
3
作者 赵兴赟 张强 +4 位作者 杨方社 郑烈龙 罗嘉昕 史治辉 问思路 《环境科学研究》 北大核心 2025年第5期990-999,共10页
陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气... 陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气污染物数据集,对陕西省PM_(2.5)浓度的时空变化特征进行研究,通过构建XGBoost模型并结合SHAP方法,分析陕西省PM_(2.5)浓度与气象、地形及植被因素和社会经济因素的关系,阐明各因素对PM_(2.5)浓度的时空影响。结果表明:①时间上,2013−2022年陕西省PM_(2.5)浓度整体呈现下降趋势,年均浓度最大值(56.02μg/m^(3))出现在2013年,在2019−2022年PM_(2.5)年均浓度低于《环境空气质量标准》(GB 3095−2012)二级标准限值(35μg/m^(3));空间上,陕西省呈现“关中高、陕南和陕北低”的污染空间格局。②在所研究的影响因素中,XGBoost-SHAP方法揭示了影响陕西省PM_(2.5)浓度的主要因素依次为高程、相对湿度、温度和人口密度,其中,高程和相对湿度对陕西省PM_(2.5)浓度具有负向影响,而温度和人口密度则表现为正向影响。③通过划分影响区发现,陕北、关中及陕南地区PM_(2.5)主要影响因素的作用方向与影响强度存在显著的空间异质性。研究显示,2013−2022年陕西省PM_(2.5)浓度大幅下降,PM_(2.5)的主要影响因素在不同区域存在空间差异,治理PM_(2.5)污染需要综合考虑区域异质性与多重影响因素的协同作用。 展开更多
关键词 PM_(2.5) XGBoost模型 shap方法 时空特征 影响因素
在线阅读 下载PDF
基于XGBoost-SHAP的预后营养指数和椎动脉阻力指数对老年轻型缺血性脑卒中患者衰弱预测模型的影响 被引量:1
4
作者 乔丽敏 赵雅宁 +3 位作者 刘瑶 赵旭 史雪菲 王明慧 《中国慢性病预防与控制》 北大核心 2025年第5期357-362,共6页
目的探讨预后营养指数(PNI)和椎动脉阻力指数(RI)对改善老年轻型缺血性脑卒中患者衰弱预测模型性能及预测能力的影响,为老年轻型缺血性脑卒中患者衰弱防治提供科学依据。方法选取2022年10月至2023年9月在华北理工大学附属医院诊治的826... 目的探讨预后营养指数(PNI)和椎动脉阻力指数(RI)对改善老年轻型缺血性脑卒中患者衰弱预测模型性能及预测能力的影响,为老年轻型缺血性脑卒中患者衰弱防治提供科学依据。方法选取2022年10月至2023年9月在华北理工大学附属医院诊治的826例老年轻型缺血性脑卒中患者为研究对象,根据出院后3个月随访是否发生衰弱分为衰弱组(220例)和无衰弱组(606例)。使用SPSS 25.0进行单因素分析及多因素logistic回归分析。采用Python 3.9.0中XGBoost机器学习算法建模,建立经典预测模型和包含PNI、RI的预测模型,通过受试者工作特征曲线下面积、准确率、灵敏度、特异度和F1分数等对模型性能进行综合评价,比较不同模型之间的差别。引入SHAP对模型进行可解释化处理。结果826例老年轻型缺血性脑卒中患者中,220例发生衰弱,占26.6%。多因素logistic回归分析显示,年龄(OR=2.697,95%CI:1.852~3.930)、脑白质中重度病变(OR=1.999,95%CI:1.356~2.947)、卒中发作次数≥2次(OR=1.949,95%CI:1.348~2.817)、共病≥2种(OR=2.134,95%CI:1.472~3.094)、RI>0.67(OR=1.689,95%CI:1.178~2.423)、PNI≤46.3(OR=2.485,95%CI:1.695~3.644)与老年轻型缺血性脑卒中患者衰弱高风险相关,中高水平体力活动(OR=0.529,95%CI:0.358~0.782)与老年轻型缺血性脑卒中患者衰弱低风险相关(P<0.05)。XGBoost建立的包含年龄、脑白质病变(WML)、卒中发作次数、共病及体力活动影响因子的经典预测模型和在此基础上加入RI、PNI以及两者联合的预测模型的受试者工作特征曲线下面积分别为0.767、0.787、0.774和0.807,准确率分别为0.741、0.770、0.758和0.810,灵敏度分别为0.865、0.880、0.859和0.842,特异度分别为0.538、0.578、0.565和0.784,F1分数分别为0.609、0.645、0.615和0.818。基于SHAP的XGBoost可解释模型特征重要度排名依次为年龄、PNI、共病、WML、体力活动、RI、卒中发作次数,整体可解释性分析结果显示年龄>70岁、PNI≤46.3、共病≥2种、脑白质中重度病变、RI>0.67、卒中发作次数≥2次对模型有正向影响,老年轻型缺血性脑卒中患者发生衰弱风险较高。中高体力活动水平对模型有负向影响,老年轻型缺血性脑卒中患者衰弱发生风险较低。结论PNI和RI提升了老年轻型缺血性脑卒中患者衰弱预测模型的性能和预测能力。 展开更多
关键词 缺血性脑卒中 衰弱 机器学习 shap方法 巢式病例对照研究
原文传递
基于XGBoost与SHAP分析的可解释性故障诊断方法研究
5
作者 李开平 张凤丽 +1 位作者 黄祖广 王金江 《制造技术与机床》 北大核心 2025年第6期199-208,共10页
针对现有智能故障诊断方法存在特征输入单一、故障难以提取、模型可解释性较差等问题,提出一种基于XGBoost(extreme gradient boosting)与SHAP(SHapley Additive exPlanations)分析的可解释性故障诊断方法。首先,采用传统信号处理方法... 针对现有智能故障诊断方法存在特征输入单一、故障难以提取、模型可解释性较差等问题,提出一种基于XGBoost(extreme gradient boosting)与SHAP(SHapley Additive exPlanations)分析的可解释性故障诊断方法。首先,采用传统信号处理方法完成多域特征的提取。其次,基于XGBoost集成算法构建故障诊断模型,并根据XGBoost内嵌评估指标对模型进行初步特征解释。最后,运用Tree SHAP方法对诊断模型进行特征解释分析,探究重要特征对轴承故障类别趋势的影响关系,分析特征之间的依赖交互效应,直观、透明地揭示模型的诊断机制。通过实验对比XGBoost与其他传统机器学习方法,本模型在多维评价指标中综合表现更为突出,且具有较强的精确性,故障诊断准确率高达99.62%,具备良好的实际应用价值。 展开更多
关键词 可解释性故障诊断方法 多域特征 XGBoost集成算法 Tree shap 特征解释
在线阅读 下载PDF
Shapley值及其应用 被引量:2
6
作者 吴孟达 毛紫阳 王丹 《数学建模及其应用》 2024年第1期110-119,共10页
Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4... Shapley值是合作博弈理论中最重要的概念之一,其在经济学、社会管理等领域具有十分广泛的应用.本文回顾了合作博弈的Shapley值的理论研究,并从Shapley-Shubik权力指数、拼车费用分摊、图博弈的Page-Shapley值以及SHAP方法与机器学习等4个方面介绍了Shapley值的应用进展. 展开更多
关键词 合作博弈 shapLEY值 权力指数 图博弈 shap方法
在线阅读 下载PDF
基于连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演 被引量:12
7
作者 叶淼 朱琳 +3 位作者 刘旭东 黄勇 陈蓓蓓 李欢 《环境科学》 EI CAS CSCD 北大核心 2024年第4期2280-2291,共12页
针对土壤有机质含量高光谱反演中存在的光谱有效信号薄弱和光谱信息冗余问题,提出结合连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演框架.以北京市延庆区和房山区永久基本农田土壤为研究对象,首先,基于连续小波变换处理的土... 针对土壤有机质含量高光谱反演中存在的光谱有效信号薄弱和光谱信息冗余问题,提出结合连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演框架.以北京市延庆区和房山区永久基本农田土壤为研究对象,首先,基于连续小波变换处理的土壤光谱反射率数据构建初始XGBoost模型;然后,利用SHAP方法分析模型中各波段的贡献度以筛选特征波段;最后,基于特征波段重新构建和优化XGBoost模型,实现土壤有机质含量高光谱反演.发现连续小波变换尺度为25时,利用SHAP方法选取的40个特征波段构建的XGBoost模型准确性最高,有机质含量反演值和实测值之间的R~2为0.80,RMSE为3.60g·kg^(-1);随着连续小波变换尺度的增大,R2呈现先升高后降低的趋势,25尺度下的R2比21尺度的高0.37;SHAP方法选取的特征波段比Pearson相关分析法少682个,RMSE低0.69 g·kg^(-1);XGBoost模型的R2分别比随机森林和支持向量机模型高4%和8%.验证了结合连续小波变换、SHAP和XGBoost在土壤有机质含量高光谱反演中的有效性,为快速、准确监测土壤有机质含量提供技术支撑. 展开更多
关键词 土壤有机质(SOM) 高光谱反演 连续小波变换 shap方法 XGBoost模型
原文传递
基于深度学习的重质馏分油分子层次组成预测模型 被引量:1
8
作者 袁壮 王源 +6 位作者 杨哲 徐伟 周鑫 赵辉 陈小博 杨朝合 林扬 《石油学报(石油加工)》 北大核心 2025年第2期362-370,共9页
随着工业大数据时代的到来,基于深度学习建立的原油分子组成预测模型具有适用范围广、构建快捷、准确性高等优点。然而,石油馏分分子层次信息标签获取困难,难以满足深度学习模型训练需求。为解决上述问题,基于商业流程模拟软件Aspen HY... 随着工业大数据时代的到来,基于深度学习建立的原油分子组成预测模型具有适用范围广、构建快捷、准确性高等优点。然而,石油馏分分子层次信息标签获取困难,难以满足深度学习模型训练需求。为解决上述问题,基于商业流程模拟软件Aspen HYSYS与GC-MS×MS全二维气相色谱-飞行时间质谱联用仪提出了一种创新方法,建立足够规模的训练数据库。采用深度神经网络(DNN)建立了重质馏分油分子层次结构组成预测模型,该模型以炼油厂易测得的油品物理化学性质为输入,分子层次结构信息为输出,针对某炼油厂的催化裂化原料油进行分子组成预测,通过SHAP(SHapley Additive exPlanation)方法对模型进行可解释分析。结果表明,基于深度学习的重质馏分油分子组成预测模型能够准确地预测油品分子层次结构信息,目标装置原料分子组成预测平均相对误差小于8%。该模型不仅可对其他炼化装置的原料油性质进行软测量,也可为石油分子层次模型的开发提供准确的重油原料分子信息模型。 展开更多
关键词 重质馏分油 分子组成 深度学习 shapley Additive exPlanation(shap)解释 分子管理
在线阅读 下载PDF
基于LSTM神经网络的核电厂瞬态参数预测与故障诊断研究 被引量:1
9
作者 刘涛 谢金森 《核动力工程》 北大核心 2025年第2期230-238,共9页
为提高核电厂瞬态工况下参数预测和故障诊断的准确性和实时性,本研究采用长短期记忆(LSTM)神经网络模型进行预测和诊断。通过生成并随机化故障情景,减少预测模型对特定模式的依赖,提高其在未知故障情景下的泛化能力。研究结合沙普利加... 为提高核电厂瞬态工况下参数预测和故障诊断的准确性和实时性,本研究采用长短期记忆(LSTM)神经网络模型进行预测和诊断。通过生成并随机化故障情景,减少预测模型对特定模式的依赖,提高其在未知故障情景下的泛化能力。研究结合沙普利加性解释性(SHAP)方法,对预测模型的参数预测结果进行解释性分析,评估不同输入特征对模型预测性能的影响,并验证该预测模型在传感器故障和数据传输错误情况下的预测准确性。此外,针对含有不同噪声水平的瞬态参数进行故障诊断,验证故障诊断模型的鲁棒性。结果表明,LSTM神经网络模型在预测和诊断方面具有较高的精度,即使在传感器故障、数据传输有误以及数据含有噪声情况下仍表现出色。本研究提出的方法能够提升核电厂运行安全和稳定性,为事故工况下的安全性提供有效技术支持。 展开更多
关键词 核电厂 瞬态参数预测 故障诊断 LSTM神经网络 沙普利加性解释性(shap)方法
原文传递
解释纠偏框架:一种基于标准解释的归因分数生成方法
10
作者 邢钟毓 梁嘉旋 +3 位作者 余国先 王峻 郭茂祖 崔立真 《计算机学报》 北大核心 2025年第4期949-970,共22页
模型可解释性研究面临一个关键挑战:对于同一数据集,不同模型尽管能达到相似的预测性能,但受训练过程中随机因素等变量影响,其输入特征的重要性评分(归因分数解释)存在显著不一致,这降低了解释的可信度。针对此问题,本文首先从理论上探... 模型可解释性研究面临一个关键挑战:对于同一数据集,不同模型尽管能达到相似的预测性能,但受训练过程中随机因素等变量影响,其输入特征的重要性评分(归因分数解释)存在显著不一致,这降低了解释的可信度。针对此问题,本文首先从理论上探讨了解释不一致与模型不确定性因素之间的联系,证明了归因解释中的SHAP(SHapley Additive exPlanation)方法在相似预测模型中的不确定性上界。在此基础上,我们通过实验深入研究了模型集合中模型训练随机因素等变量对特征归因方法的影响,发现模型不确定导致的解释不确定性普遍存在,而SHAP方法由于其上界的影响不确定性较低。据此,我们提出了一种基于不同模型的标准解释生成稳定归因分数解释的纠偏框架ASGM(Attribution Score Generation Method),以减少归因分数解释的不一致,提升模型解释的稳定性和可信度。该框架通过检测少量抽样模型解释与大量模型生成标准解释之间的差异,利用校正偏差的深度学习模型,生成代表规格不足集或罗生门效应集的归因分数解释,并能预测规格不足集解释间的不确定性。实验结果表明,ASGM可以生成受模型(尤其是随机因素)影响较小的解释,生成解释的质量高于对模型集合解释排名的均值,接近标准解释。此外,与标准解释相比,ASGM在罗生门效应集上的计算时间减少了20%~30%,在规格不足集上减少了17%~48%,这些结果验证了ASGM可有效提升解释稳定性和可信度。 展开更多
关键词 模型不确定性 可解释人工智能 规格不足集 罗生门效应集 shap方法
在线阅读 下载PDF
基于机器学习的±800 kV干式平波电抗器震后状态评估方法
11
作者 叶芳怡 刘匀 +1 位作者 朱旺 谢强 《高压电器》 北大核心 2025年第4期1-11,共11页
为实现电气设备的震后状态快速评估,以保障电力系统的应急决策与灾后恢复顺利进行,文中提出一种基于机器学习的评估方法。以±800 kV干式平波电抗器为研究对象,建立Abaqus有限元模型进行地震响应分析确定其抗震薄弱环节。向有限元... 为实现电气设备的震后状态快速评估,以保障电力系统的应急决策与灾后恢复顺利进行,文中提出一种基于机器学习的评估方法。以±800 kV干式平波电抗器为研究对象,建立Abaqus有限元模型进行地震响应分析确定其抗震薄弱环节。向有限元模型中输入大量地震波计算获得用于建立评估模型所需的机器学习数据集,采取相关性分析法剔除冗余特征,选取不同机器学习算法比较其评估性能,并通过SHAP(shapley additive explanations)解释评估模型,以此避免机器学习模型的“黑箱”特性。结果表明:平波电抗器的抗震薄弱环节为支撑绝缘子根部应力响应;基于XGBoost算法架构的评估模型具有最优性能;SHAP法可从全局和局部层面揭示地震动参数对设备震后状态的影响。基于机器学习算法建立的评估模型能够快速准确地评估设备震后状态,可为变电站或换流站整站的智能化防灾系统建立提供技术支撑。 展开更多
关键词 ±800 kV干式平波电抗器 震后评估 机器学习 shap
在线阅读 下载PDF
珠江三角洲地区用水量影响要素及其关联规则
12
作者 郑炎辉 徐小迪 +2 位作者 李俊辉 林树彦 何艳虎 《中山大学学报(自然科学版)(中英文)》 北大核心 2025年第2期22-32,共11页
区域用水量影响要素及其关联规则识别对于合理预测用水需求和优化配置水资源具有重要意义。本文基于珠三角地区历年水资源开发利用数据和经济社会发展统计数据,利用随机森林(RF,random forest)和人工神经网络(ANN,artificial neural net... 区域用水量影响要素及其关联规则识别对于合理预测用水需求和优化配置水资源具有重要意义。本文基于珠三角地区历年水资源开发利用数据和经济社会发展统计数据,利用随机森林(RF,random forest)和人工神经网络(ANN,artificial neural network)两种机器学习模型,并综合采用SHAP(shapley additive explanations)和部分依赖图(PDP,partial dependence plots)方法,系统识别了珠三角地区用水量影响要素及其与用水量的关联规则,揭示了各影响要素贡献度的时空变化特征。结果表明:用水量影响要素按重要度排序依次是GDP、人口规模、耕地面积、人均水资源量、农田实灌单位面积平均用水量、城镇人均生活用水量;ANN模型和RF模型决定系数平均值分别在0.94和0.92以上;用水量影响要素空间上呈现中心城市以人口为主导、周边地区以耕地面积为主导的特点;珠三角地区用水量对于人口规模和耕地面积变化的响应最为明显。研究可为珠三角地区未来用水需求预测以及水资源空间均衡配置提供科学依据与技术支撑。 展开更多
关键词 人工神经网络 随机森林 用水量 shap方法 PDP
在线阅读 下载PDF
长三角地区绿色低碳发展的时空演变及其驱动因素分析
13
作者 陈友 谭本艳 郭颖珠 《环境科学研究》 北大核心 2025年第10期2136-2146,共11页
在“双碳”目标背景下,长三角作为我国经济最活跃地区,其绿色低碳转型对全国可持续发展具有示范意义。本文以长三角地区为研究对象,构建绿色低碳发展评价体系,探讨其绿色低碳发展的时空演变特征,并通过XGBoost机器学习算法及SHAP可解释... 在“双碳”目标背景下,长三角作为我国经济最活跃地区,其绿色低碳转型对全国可持续发展具有示范意义。本文以长三角地区为研究对象,构建绿色低碳发展评价体系,探讨其绿色低碳发展的时空演变特征,并通过XGBoost机器学习算法及SHAP可解释性分析识别其核心驱动因素及交互影响。结果表明:①长三角地区绿色低碳发展水平呈现上升趋势,但区域发展不平衡。②长三角地区绿色低碳发展存在局部空间自相关,部分城市有“高-高”集聚和“低-低”集聚特征。③环保卫生投资、电车数量、绿色发明专利、绿地面积、二氧化硫排放量、二氧化碳排放量是影响绿色低碳发展排名前六的驱动因素,其中前四位促进绿色低碳发展,后两位起抑制作用。④在高碳排放背景下,推广公交电车出行和绿色技术创新对改善绿色低碳水平的边际效应更为明显。研究显示,长三角地区未来绿色低碳发展水平的提升需依托区域协同治理及产业绿色升级。因此,应结合区域实际情况,强化区域间协同合作,增加环保投资力度,拓展新能源电车应用优势,推动绿色技术创新,并调整高能耗产业结构,以此促进长三角及全国绿色低碳转型实现高质量发展。 展开更多
关键词 绿色低碳发展 长三角地区 XGBoost算法 shap方法
在线阅读 下载PDF
基于机器学习算法的城市生活垃圾修正主压缩指数预测模型
14
作者 楼杨帆 张振营 《浙江理工大学学报(自然科学版)》 2025年第1期88-95,共8页
为准确预测老垃圾填埋场竖向扩容设计中城市生活垃圾的修正主压缩指数,首先采集西安江村沟垃圾填埋场不同填埋龄期的垃圾试样,通过室内试验测定120组试样的基本土工参数和修正主压缩指数,并利用决策树、随机森林、人工神经网络和极端梯... 为准确预测老垃圾填埋场竖向扩容设计中城市生活垃圾的修正主压缩指数,首先采集西安江村沟垃圾填埋场不同填埋龄期的垃圾试样,通过室内试验测定120组试样的基本土工参数和修正主压缩指数,并利用决策树、随机森林、人工神经网络和极端梯度提升树这4种机器学习算法建立修正主压缩指数预测模型;其次收集国内外其他生活垃圾填埋场的试验数据,将其与24组试验数据组合,构建测试集;再次选取均方根误差、平均绝对误差以及判定系数作为评价指标,得到最佳预测效果的模型,并将该模型与文献预测模型的预测结果进行对比;最后采用SHAP(SHapley Additive exPlanations)值法对最佳预测效果的模型进行参数影响分析。结果表明:在4种机器学习算法中,人工神经网络的预测效果最佳,且具有更好的泛化能力;与文献预测模型相比,人工神经网络预测模型的预测效果更好;干重度对修正主压缩指数的影响程度最显著,且与修正主压缩指数呈负相关关系。该研究构建的预测模型,可以直接使用容易获取的基本土工参数来预测修正主压缩指数,不需要费时费力的压缩试验。研究结果可为老垃圾填埋场的竖向扩容设计提供参考依据。 展开更多
关键词 城市生活垃圾 基本土工参数 修正主压缩指数 机器学习 预测模型 shap值法
原文传递
结合可解释分析的多模型堆叠乳腺癌住院费用预测
15
作者 朱海玉 孙晓燕 +1 位作者 袁贞明 杨丽静 《计算机与现代化》 2025年第9期119-126,共8页
住院费用是影响乳腺癌患者治疗选择和预后的因素之一,精准预测住院费用及个性化分析费用影响因素对于有效配置资源和优化医疗服务至关重要。针对单一模型在住院费用预测任务上存在泛化能力弱且可解释差的问题,本文提出一种可解释的堆叠... 住院费用是影响乳腺癌患者治疗选择和预后的因素之一,精准预测住院费用及个性化分析费用影响因素对于有效配置资源和优化医疗服务至关重要。针对单一模型在住院费用预测任务上存在泛化能力弱且可解释差的问题,本文提出一种可解释的堆叠方法,充分整合多种模型的特征提取能力,实现对乳腺癌患者住院费用的准确预测。该方法采用2层模型融合结构,第1层选择4个基模型,并利用贝叶斯优化和五折交叉验证技术优化参数,提高每个模型的预测性能,再由第2层线性回归输出最终的费用。此外,本文还使用SHAP和LIME方法从整体和个体角度分析乳腺癌住院费用预测结果。在某医院乳腺癌住院患者数据集上的实验结果表明,堆叠方法在费用预测任务中的R^(2)为0.877,优于其他相关研究。可解释性分析结果表明,住院时长和治疗方式是影响住院费用的主要因素,但不同患者的影响因素存在个体化差异,这为更深入了解影响住院费用的关键因素提供了宝贵的见解。 展开更多
关键词 住院费用预测 可解释的堆叠方法 shap LIME 机器学习
在线阅读 下载PDF
基于机器学习算法的C_(8)芳烃异构化催化剂性能预测模型
16
作者 陈芳 任小甜 +2 位作者 康承琳 周震寰 唐晓津 《石油学报(石油加工)》 北大核心 2025年第6期1472-1484,共13页
采用机器学习算法建立C_(8)芳烃异构化催化剂性能预测模型,并利用模型解释(SHAP)方法对模型结果进行特征分析,探究原料组成、催化剂性质和工艺条件对催化剂性能的影响规律。结果表明,相较于最近邻、随机梯度下降等非树模型,基于决策树... 采用机器学习算法建立C_(8)芳烃异构化催化剂性能预测模型,并利用模型解释(SHAP)方法对模型结果进行特征分析,探究原料组成、催化剂性质和工艺条件对催化剂性能的影响规律。结果表明,相较于最近邻、随机梯度下降等非树模型,基于决策树的集成模型表现出最佳的预测性能。对于使用乙苯脱烷基型催化剂的反应过程,二甲苯异构化活性、乙苯转化率和二甲苯收率预测模型的决定系数(R^(2))分别为0.78、0.93和0.96。对于使用乙苯转化型催化剂的反应过程,二甲苯异构化活性、乙苯转化率和C_(8)芳烃收率预测模型的R^(2)分别为0.91、0.97和0.90。通过比较硅/铝比、比表面积、孔体积、金属负载量的SHAP值可知,催化剂的比表面积与硅/铝比是决定乙苯脱烷基型催化剂性能的关键特征。而对于乙苯转化型催化剂,通过比较原料组成和比表面积、孔体积、金属负载的SHAP值可知,金属负载量是影响其活性的主要因素;对比不同反应温度、反应压力、质量空速、氢/烃比,反应温度与质量空速对催化反应效果具有显著影响。 展开更多
关键词 机器学习 C_(8)芳烃异构化 催化剂 模型 模型解释(shap)方法
在线阅读 下载PDF
基于多源时序数据的煤矿入井人员风险预警研究
17
作者 杨欢 屈世甲 +1 位作者 赵乾坤 王健 《工矿自动化》 北大核心 2025年第10期7-15,共9页
针对煤矿多变量时序数据非线性耦合强及空间异构性显著的问题,提出了一种融合多源时序数据的煤矿入井人员风险预警模型。采用基于同向双指针滑动窗口的多模态数据同步方法,结合卡尔曼滤波,引入延迟补偿机制提高插值精度,实现了不同采样... 针对煤矿多变量时序数据非线性耦合强及空间异构性显著的问题,提出了一种融合多源时序数据的煤矿入井人员风险预警模型。采用基于同向双指针滑动窗口的多模态数据同步方法,结合卡尔曼滤波,引入延迟补偿机制提高插值精度,实现了不同采样频率信号的高精度时间对齐;构建十维特征向量,利用SHAP方法进行全局重要性与局部重要性分析,剔除冗余特征,实现了高效降维,在保证预测性能的同时显著提升了模型决策的可解释性与鲁棒性;引入多头优化注意力机制(MOA)捕捉多源信号的非线性依赖与潜在耦合特征,构建MOA−Transformer模型,利用Transformer编码器结构进行特征工程等级预警分类,再通过MOA构建分类的特征表示。现场实测结果表明,该模型在准确率、精确率、召回率、F1分数等指标上显著优于循环神经网络、卷积神经网络等模型,在少量异常事件的条件下亦具备较高检出率与低误报率,为煤矿入井人员风险识别与分级预警提供了可行的技术路径。 展开更多
关键词 煤矿入井人员 风险预警 时序数据同步 同向双指针滑动窗口 特征重要性分析 shap方法 MOA−Transformer
在线阅读 下载PDF
基于机器学习的社区建成环境对老年人步行时间的影响
18
作者 朱震军 何展鹏 +2 位作者 俞佳雯 韩吉 李晴 《科学技术与工程》 北大核心 2025年第18期7832-7842,共11页
为探究社区建成环境对老年人步行时间的影响,考虑到老年群体的性别差异,构建CatBoost模型并结合SHAP解释方法(Shapley additive explanations, SHAP),对比分析社区建成环境与不同性别老年人步行时间的特征相对重要度及非线性关系。研究... 为探究社区建成环境对老年人步行时间的影响,考虑到老年群体的性别差异,构建CatBoost模型并结合SHAP解释方法(Shapley additive explanations, SHAP),对比分析社区建成环境与不同性别老年人步行时间的特征相对重要度及非线性关系。研究结果表明:相较于个人社会经济属性变量,社区建成环境变量对老年人步行时间影响更显著,但对不同性别老年人的影响效应有所差异。其中,相较于老年男性,老年女性更关注与社交需求密切的建成环境变量,如归一化植被指数(normalized difference vegetation index, NDVI)、人口密度等。而老年男性的步行时间与个人社会经济属性联系更加紧密,步行时间多与交通便捷性、出行效率相关。 展开更多
关键词 社区建成环境 老年人 步行时间 CatBoost模型 shap解释方法
在线阅读 下载PDF
基于GA-BP神经网络算法的桥梁C50混凝土生产质量控制
19
作者 姚吉 《上海公路》 2025年第3期129-136,I0012,共9页
为有效控制桥梁C50混凝土生产质量,结合实际工程,采集了拌和站配合比生产及抗压强度的检测数据,通过遗传算法优化的人工神经网络(GA-BP),建立了混凝土抗压强度控制模型,并通过SHAP法,对原模型参数特征进行了敏感性分析,构建了混凝土生... 为有效控制桥梁C50混凝土生产质量,结合实际工程,采集了拌和站配合比生产及抗压强度的检测数据,通过遗传算法优化的人工神经网络(GA-BP),建立了混凝土抗压强度控制模型,并通过SHAP法,对原模型参数特征进行了敏感性分析,构建了混凝土生产质量控制的GA-BP-SHAP模型。研究结果表明,GA-BP算法能够有效学习水泥混凝土各组成成分对抗压强度形成的影响特征,且建立的C50混凝土质量控制模型的精度能够满足现场要求。影响混凝土强度的主要因素排序为:水(W)>粗集料(Ca)>外加剂(P)>细集料(Fa)>水泥(C)。研究提出的GA-BP-SHAP模型可以快速预测C50混凝土的抗压强度并分析主要材料的敏感性,对桥梁工程现场质量管理具有一定的指导意义。 展开更多
关键词 桥梁施工 水泥混凝土 抗压强度 遗传算法 人工神经网络 shap
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部