期刊文献+
共找到88篇文章
< 1 2 5 >
每页显示 20 50 100
基于RFE-SHAP的具有可解释性纱线质量预测研究
1
作者 张保威 郭智林 王永华 《棉纺织技术》 2026年第1期2-9,共8页
为优化纱线质量预测的特征选择过程,进一步消除小样本环境下存在的冗余特征,提高后续预测过程的准确性、可靠性,提出了一种基于结合递归特征消除算法(RFE)和SHAP的具有可解释性的纱线质量预测方法,即RFE⁃SHAP。首先,选择RFE作为迭代特... 为优化纱线质量预测的特征选择过程,进一步消除小样本环境下存在的冗余特征,提高后续预测过程的准确性、可靠性,提出了一种基于结合递归特征消除算法(RFE)和SHAP的具有可解释性的纱线质量预测方法,即RFE⁃SHAP。首先,选择RFE作为迭代特征选择方法,将支持向量回归(SVR)作为其评估器;然后,引入SHAP技术去量化原始特征对纱线强力及毛羽H值两种纱线质量指标的边际贡献值,从而辅助特征选择,进而提供更直观且解释性更强的特征选择策略;最后,结合神经网络构建纱线强力以及毛羽H值的预测模型。试验结果证明:经RFE⁃SHAP算法得到的最优特征子集作为纱线强力及毛羽H值预测模型的输入时,模型多个评价指标的效果均有提升,其中,对两种纱线质量指标预测的平均绝对百分比误差均未超过3%。认为:该方法具有较高的可行性,可以在一定程度上提高模型的预测性能。 展开更多
关键词 纱线质量预测 特征选择 递归特征消除算法 支持向量回归 shap技术
在线阅读 下载PDF
基于XGBoost⁃SHAP方法的建设项目碳排放空间异质性分析 被引量:2
2
作者 王元庆 李佳玥 +1 位作者 刘备 王芳 《环境科学》 北大核心 2025年第7期4090-4100,共11页
为使公路建设碳减排更有效,聚焦高速公路建设过程中的碳排放空间异质性,基于广东省A高速公路项目40个分段样本筛选出的构造物类型、桥隧比、设计坡度、路线长度、填方量、挖方量和水泥消耗量这7个碳排放影响关键指标,训练与验证了XGBoos... 为使公路建设碳减排更有效,聚焦高速公路建设过程中的碳排放空间异质性,基于广东省A高速公路项目40个分段样本筛选出的构造物类型、桥隧比、设计坡度、路线长度、填方量、挖方量和水泥消耗量这7个碳排放影响关键指标,训练与验证了XGBoost碳排放预测模型,构建了解释这40个路段碳排放空间异质性的SHAP算法,研究了路段特征对碳排放的影响、总特征贡献和特征交互效应.结果表明,水泥消耗量的增加对碳排放的非线性增长贡献最大,路线长度、挖方量和桥隧比对碳排放的贡献度也较为显著;冷热点分析发现坡度高于2.5%且地形复杂的路段碳排放趋高,存在聚集效应;XGBoost-SHAP模型较地理加权回归模型GWR能更清晰解释碳排放的空间分布特征及其影响因素,在捕捉关键碳源和理解碳排放空间分布特征方面表现更佳.基于以上发现,提出了公路建养碳减排的针对性综合策略,以推动公路建设的可持续发展. 展开更多
关键词 碳排放 空间异质性 XGBoost算法 shap算法 可解释性
原文传递
基于LightGBM和SHAP算法的致密油储层孔隙度预测 被引量:2
3
作者 王伟 党海龙 +3 位作者 康胜松 肖前华 丁磊 石立华 《油气地质与采收率》 北大核心 2025年第5期90-99,共10页
为了准确高效地表征致密油储层孔隙度的空间分布特征,同时对机器学习模型的可解释性进行评价,采用Z-Score方法对特征属性进行归一化处理,并应用Optuna超参数优化框架对模型的超参数进行调优,建立了一种基于LightGBM算法的孔隙度预测模型... 为了准确高效地表征致密油储层孔隙度的空间分布特征,同时对机器学习模型的可解释性进行评价,采用Z-Score方法对特征属性进行归一化处理,并应用Optuna超参数优化框架对模型的超参数进行调优,建立了一种基于LightGBM算法的孔隙度预测模型,与GBDT和XGBoost算法模型进行了预测效果的综合对比,并利用SHAP算法对LightGBM模型的输出结果进行了可视化解释分析。研究结果表明:LightGBM模型在训练数据集和测试数据集上的预测决定系数分别为0.984和0.855,模型预测准确度高、泛化能力强,综合预测效果好于GBDT和XGBoost模型。应用SHAP算法对LightGBM模型结果的可解释性进行分析,结果表明,影响LightGBM孔隙度预测模型最重要的5项测井参数为密度、阵列感应电阻率、自然伽马、声波时差和光电吸收截面指数。在研究区某单井X致密层段孔隙度的预测实例中,LightGBM模型预测准确度达93.9%,分别高于GBDT和XGBoost模型的预测准确度86.53%和89.08%;训练时长为0.016 s,分别为GBDT和XGBoost模型训练时长的0.096倍和0.025倍;预测时长为0.01 s,分别为GBDT和XGBoost模型预测时长的0.42倍和0.19倍;LightGBM模型的预测效率相对GBDT和XGBoost模型具有明显优势,其在取心井段上对孔隙度的预测误差更小,预测能力更强,且能更好地拟合低值孔隙度。该方法的应用不仅解决了单井致密层段获取完整准确孔隙度分布的难题,而且提高了孔隙度预测的精度和效率,对致密油储层的评价及高效勘探开发具有一定的参考价值。 展开更多
关键词 致密油储层 机器学习 LightGBM算法 shap算法 孔隙度预测
在线阅读 下载PDF
一种兼具精度与可解释性的Stacking-SHAP滑坡易发性预测集成方法
4
作者 黄鑫 叶健 +3 位作者 刘骋冰 曾秋雨 郭万新 郭志凯 《测绘学报》 北大核心 2025年第10期1826-1840,共15页
滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性... 滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性预测的准确性与诱因分析的可靠性。本文方法采用Stacking集成框架,融合XGBoost、CatBoost、LightGBM、逻辑回归(LR)、随机森林(RF)等多种机器学习分类器,在保证预测精度的基础上,引入SHAP(shapley additive explanations)算法,以增强模型的可解释性。试验结果表明,Stacking-SHAP模型的AUC值达到0.920,显著优于单一分类器模型,如XGBoost(0.893)、CatBoost(0.894)、LightGBM(0.879)、RF(0.859)和LR(0.794)。更重要的是,相较于SHAP集成单一机器学习模型,Stacking-SHAP可解释增强集成模型在滑坡诱因分析方面表现出更优的综合性能,提高了滑坡致灾因素分析的可信度。整体而言,本文方法兼具高精度预测与高可靠性解释,为滑坡易发性预测与诱因分析提供了一种创新性方法,在滑坡防治与减灾领域具有重要的理论与应用价值。 展开更多
关键词 滑坡易发性 地理大数据 Stacking算法 shap算法 滑坡诱因分析
在线阅读 下载PDF
基于分层时空框架的共享单车需求预测:LP-TFT模型与SHAP可解释分析
5
作者 李聪颖 袁锴璐 +3 位作者 李静怡 郑晓晶 李坤 何源 《中国公路学报》 北大核心 2025年第10期305-323,共19页
为揭示共享单车系统需求演变规律,并明确不同因素对需求的影响,提出一种融合特征解耦与深度学习的集群-站点级分层时空预测框架。首先,基于站点间的关联性与相似性改进LP算法,构建站点集群划分模型,其中关联性通过空间距离与出行流量表... 为揭示共享单车系统需求演变规律,并明确不同因素对需求的影响,提出一种融合特征解耦与深度学习的集群-站点级分层时空预测框架。首先,基于站点间的关联性与相似性改进LP算法,构建站点集群划分模型,其中关联性通过空间距离与出行流量表征,相似性通过POI相似度与历史出行量相似度加权表征;引入借还不平衡差异指数评价聚类效果,以最小化借还不平衡差异指数为目标进行站点集群划分;在此基础上,分别建立基于TFT模型的集群级与站点级需求预测模型,并将集群级预测结果整合进站点级预测过程中;最后,运用SHAP方法解析不同因素对集群级与站点级共享单车需求的影响机制。研究结果表明:集群级需求预测过程中,小时特征对集群级需求的影响最显著,表现为夜间抑制、日间促进,气象因素呈现双向调节作用,在温度适中、气压较高、风速与湿度较低时对需求产生促进作用;站点级需求预测过程中,集群需求为核心影响因素,随着集群级结果的引入,站点级预测结果的决定系数R^(2)由0.7679提升至0.8504,平均绝对误差MAE由1.2152降至0.9755,误差降低约19.73%;气象因素在站点层级展现出一定的独立影响趋势,如在部分低温、高湿或风速较大的情境下仍可能促进需求,表明站点级需求不仅依赖于集群需求的整体波动,还受站点周边环境的影响,具有一定独立性。研究构建了基于分层时空框架的共享单车需求预测方法,可为共享单车需求驱动因素识别与动态调度提供决策支持。 展开更多
关键词 交通工程 共享单车需求预测 LP算法 TFT算法 shap可解释分析
原文传递
基于E5-SHAP算法的可解释英语作文自动评分语言模型
6
作者 王兵 单瑞雪 +1 位作者 邢海燕 李盼池 《智能科学与技术学报》 2025年第3期370-380,共11页
针对英语作文自动评分系统因依赖复杂深度学习模型而缺乏可解释性的问题,提出了一种基于E5-SHAP算法的可解释英语作文自动评分模型。该模型基于E5-Base模型编码器提取文本特征,结合均值计算和回归层实现评分输出,并引入自适应加权机制,... 针对英语作文自动评分系统因依赖复杂深度学习模型而缺乏可解释性的问题,提出了一种基于E5-SHAP算法的可解释英语作文自动评分模型。该模型基于E5-Base模型编码器提取文本特征,结合均值计算和回归层实现评分输出,并引入自适应加权机制,从语法、句法、词汇多样性等6个维度综合评估作文质量。模型采用LoRA微调技术优化特定层参数,提高对作文特征的适应性。通过SHAP算法计算各特征对最终评分的影响,从而提供清晰的评分依据和解释路径,提升评分过程的透明性和可信度。实验结果表明,与现有模型相比,该模型在ELLIPSE数据集和自建数据集上的表现均有所提升,二次加权卡帕值(QWK)达0.84,在准确性和可解释性上优于现有模型。 展开更多
关键词 英语作文 自动评分模型 E5-shap算法 可解释性
原文传递
基于特征选择的SHAP-Transformer高炉铁水硅含量预报模型 被引量:3
7
作者 马居安 郑华伟 +4 位作者 刘栋梁 陆昊 周进东 毕学工 熊玮 《钢铁》 北大核心 2025年第8期68-78,共11页
数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal c... 数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal component analysis,PCA)将22个分钟级的特征参数转化为铁次级参数,进一步采用滑动窗口和最大信息系数(maximal information coefficient,Cimax)确定了参数的滞后时长。利用随机森林优化的SHAP算法对34个参数在强耦合条件下的重要性进行评估,筛选出7个关键参数。使用SHAP算法优化Transformer的自注意力机制,构建了SHAP-Transformer铁水硅含量预报模型,通过现场数据验证了模型的有效性。结果表明,铁水硅质量分数预测误差为-0.05~0.05和-0.1~0.1时,基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型的命中率最高,分别为72.12%和95.76%,比基于MIC参数选择的SHAP-Transformer模型提高了26.67%和21.21%,比基于滑动窗口时滞分析及耦合参数优选的长短时记忆网络(long short-term memory,LSTM)模型提高了17.57%和9.7%。基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型对铁水硅含量的变化趋势预测也有较高的精度,趋势方向预测的准确率为87.3%,趋势类别预测的准确率为60.5%,研究能够为高炉操作者提前判断炉温变化提供可靠依据。 展开更多
关键词 高炉 铁水硅含量 特征选择 时滞分析 随机森林 shap算法 炼铁 预报模型
原文传递
基于机器学习和SHAP算法的声波测井曲线重构及可解释性分析 被引量:8
8
作者 黎子豪 蒋恕 《地质科技通报》 北大核心 2025年第1期321-331,共11页
测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间... 测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间的关系模型使得曲线重构精度相对较低,机器学习算法虽能在大量数据之间找到最为合适的数据映射关系进而提高模型精度,但相较而言其所构建的黑箱模型无法得到良好的解释。近期,可解释性算法的运用使得机器学习在重构测井曲线中的应用更为合理。通过将支持向量回归(support vector regression,简称SVR),随机森林(random forest,简称RF)以及极限梯度提升(extreme gradient boosting,简称XGBoost)和传统多元线性回归方法(linear regression,简称LR)的对比对英国能源局22-30b-11号井声波测井曲线进行了模型重构并基于shapley additive explanations(SHAP)算法对XGBoost模型进行了解释。结果表明,XGBoost在测试集上的决定系数(R2)和均方误差(MSE)分别为0.996,6.371,优于SVR的0.990、15.755和RF的0.993、9.871,而传统多元线性回归方法则为0.969、48.895,表明XGBoost对声波时差曲线的重构具有更高的准确度和更好的泛化性能。创新性地采用SHAP算法对XGBoost黑箱模型的解释表明,在模型构建选择重要特征时,XGBoost模型采用地层温度数据作为特征明显合理于多元线性回归方法采用的井径测井数据。最后基于SHAP对模型进行了单点和全局特征交互解释。上述结果表明在声波测井曲线重构方面,机器学习算法明显优于传统的多元线性回归方法,并证明了SHAP算法在声波测井曲线重构机器学习模型解释方面的可行性,为后续机器学习在测井解释中的发展提供了新的思路。 展开更多
关键词 测井曲线重构 机器学习 模型解释 shap算法 声波测井
在线阅读 下载PDF
基于TPE-SVM模型和SHAP解释的闪锌矿微量元素特征识别铅锌矿床类型 被引量:1
9
作者 陈忠元 任涛 赵冻 《地球科学》 北大核心 2025年第11期4355-4369,共15页
为了解闪锌矿微量元素特征对不同成因矿床类型是否能够进行有效判别,系统收集了全球典型的沉积喷流型(SEDEX)、密西西比河谷型(MVT)、火山块状硫化物型(VMS)、矽卡岩型(skarn)和浅成低温热液型(epithermal)铅锌矿床中3117条闪锌矿的12... 为了解闪锌矿微量元素特征对不同成因矿床类型是否能够进行有效判别,系统收集了全球典型的沉积喷流型(SEDEX)、密西西比河谷型(MVT)、火山块状硫化物型(VMS)、矽卡岩型(skarn)和浅成低温热液型(epithermal)铅锌矿床中3117条闪锌矿的12种微量元素含量数据(Mn、Fe、Co、Cu、Ga、Ge、Ag、Cd、In、Sn、Sb、Pb),使用基于Tree-structured Parzen Estimator(TPE)优化的支持向量机机器学习算法建立了闪锌矿微量元素分类模型,并使用SHAP(SHapley Additive exPlanations)方法进行特征重要性分析.结果表明,经优化的TPE-SVM模型在测试集上展现出优异的分类能力,准确率、召回率和F1值均超过0.97.通过SHAP解释发现闪锌矿中Mn、Ge、Co为矿床成因类型判别三大关键元素.本文建立的闪锌矿微量元素判别指标体系,不仅为矿床成因鉴定提供了新的技术手段,更可为复合成矿系统解析、隐伏矿体预测等复杂地质问题提供创新解决方案. 展开更多
关键词 闪锌矿 微量元素 机器学习 TPE优化算法 shap算法 矿床地质
原文传递
良性前列腺增生并发膀胱结石的危险因素分析及基于SHAP的可解释性预测模型构建
10
作者 赵欢 欧阳松 +1 位作者 董洪超 王勤章 《现代泌尿外科杂志》 2025年第8期653-661,共9页
目的探讨良性前列腺增生(BPH)患者并发膀胱结石(BS)的独立危险因素,构建预测模型和部署便于使用的网站。方法回顾性分析2022年1月—2025年1月石河子大学第一附属医院泌尿外科收治的460例BPH患者的临床资料,通过单因素逻辑回归结合Borut... 目的探讨良性前列腺增生(BPH)患者并发膀胱结石(BS)的独立危险因素,构建预测模型和部署便于使用的网站。方法回顾性分析2022年1月—2025年1月石河子大学第一附属医院泌尿外科收治的460例BPH患者的临床资料,通过单因素逻辑回归结合Boruta算法共同识别训练集患者中BPH并发BS的独立危险因素,并基于危险因素构建列线图模型。通过受试者工作特征(ROC)曲线、灵敏度、特异度、阳性预测值(PPV)、阴性预测值(NPV)、F1指数、校准曲线和临床决策曲线(DCA)综合评价模型预测效能;使用SHAP算法评估不同变量对BPH并发BS的贡献度。并基于预测模型建立便于使用的网页。结果460例BPH患者中并发BS者144例(31.3%)。单因素逻辑回归结合Boruta算法共识别出中性粒细胞占比、尿培养结果、膀胱内前列腺突出度(IPP)、尿亚硝酸盐检测结果、尿白细胞检测结果和尿潜血结果6个独立危险因素。测试集中,该列线图的ROC曲线下面积为0.887(95%CI:0.816~0.947),灵敏度、特异度、PPV、NPV和F1指数分别为0.705、0.968、0.912、0.876和0.795,校准曲线和DCA均展示出良好的区分能力和临床应用能力。SHAP结果显示IPP、尿白细胞检测结果、尿培养结果、中性粒细胞占比、尿亚硝酸盐检测结果和尿潜血结果是BPH并发BS最重要的危险因素。最终建立可公开访问的BPH并发BS诊断的网站(https://wutiaowu2.shinyapps.io/bladderrrr/)。结论中性粒细胞占比、尿培养结果、IPP、尿亚硝酸盐检测结果、尿白细胞检测结果和尿潜血结果是BPH并发BS的独立影响因素,基于此构建的模型及网页易用且准确度高,具有较高的临床实用价值。 展开更多
关键词 前列腺增生 膀胱结石 列线图 预测模型 shap算法
暂未订购
基于路径规划数据与RF-SHAP算法的湘西州乡村教育设施可达性及其影响因素研究
11
作者 李光宇 丁国胜 +2 位作者 何韶瑶 屈野 张梦淼 《西部人居环境学刊》 北大核心 2025年第4期115-121,共7页
教育设施可达性是表征乡村地区教育水平的重要维度。以湘西土家族苗族自治州为例,基于高德地图开放平台路径规划数据服务,建构一个获取区域内“村庄—教育设施”的最短路径时间的系统运行方案,精准、高效测度乡村地区教育设施可达性水... 教育设施可达性是表征乡村地区教育水平的重要维度。以湘西土家族苗族自治州为例,基于高德地图开放平台路径规划数据服务,建构一个获取区域内“村庄—教育设施”的最短路径时间的系统运行方案,精准、高效测度乡村地区教育设施可达性水平。运用克里金插值、空间自相关等方法分析乡村地区教育设施可达性水平的空间格局总体特征和空间集聚特征,运用随机森林模型与SHAP方法(RF-SHAP算法)探索设施可达性影响因素及非线性关系。结果表明:湘西乡村教育设施可达性总体水平欠佳;在各县域中形成了以县城中心向外围逐渐降低的乡村教育设施可达性水平空间分布特征且集聚特征差异显著;其关键影响因素主要包括人口密度、建设用地比率和平均高程,反映了城镇化水平与自然环境特征对可达性水平具有非线性影响。研究对推动实现脱贫地区城乡公共服务均等化具有重要理论与现实意义。 展开更多
关键词 路径规划 RF-shap算法 乡村教育设施 可达性 影响因素
在线阅读 下载PDF
基于XGBoost与SHAP分析的可解释性故障诊断方法研究
12
作者 李开平 张凤丽 +1 位作者 黄祖广 王金江 《制造技术与机床》 北大核心 2025年第6期199-208,共10页
针对现有智能故障诊断方法存在特征输入单一、故障难以提取、模型可解释性较差等问题,提出一种基于XGBoost(extreme gradient boosting)与SHAP(SHapley Additive exPlanations)分析的可解释性故障诊断方法。首先,采用传统信号处理方法... 针对现有智能故障诊断方法存在特征输入单一、故障难以提取、模型可解释性较差等问题,提出一种基于XGBoost(extreme gradient boosting)与SHAP(SHapley Additive exPlanations)分析的可解释性故障诊断方法。首先,采用传统信号处理方法完成多域特征的提取。其次,基于XGBoost集成算法构建故障诊断模型,并根据XGBoost内嵌评估指标对模型进行初步特征解释。最后,运用Tree SHAP方法对诊断模型进行特征解释分析,探究重要特征对轴承故障类别趋势的影响关系,分析特征之间的依赖交互效应,直观、透明地揭示模型的诊断机制。通过实验对比XGBoost与其他传统机器学习方法,本模型在多维评价指标中综合表现更为突出,且具有较强的精确性,故障诊断准确率高达99.62%,具备良好的实际应用价值。 展开更多
关键词 可解释性故障诊断方法 多域特征 XGBoost集成算法 Tree shap 特征解释
在线阅读 下载PDF
基于SHAP-GA-XGBoost融合模型的北京公路货运量预测研究
13
作者 安海岗 孙晓蕾 《物流科技》 2025年第22期93-99,共7页
在北京市公路货运系统日益复杂且对城市经济与物流运转至关重要的背景下,精准预测北京市公路货运量,可为政府交通规划、能源结构调整及应急响应提供科学依据。因此,文章构建SHAP-GA-XGBoost融合模型以更精准的预测北京市公路货运量。首... 在北京市公路货运系统日益复杂且对城市经济与物流运转至关重要的背景下,精准预测北京市公路货运量,可为政府交通规划、能源结构调整及应急响应提供科学依据。因此,文章构建SHAP-GA-XGBoost融合模型以更精准的预测北京市公路货运量。首先,基于需求驱动、供给能力等五大维度,筛选出24个影响北京市公路货运量的初始指标,并使用混频数据模型与KNN反距离权重插值完成数据预处理;其次,利用SHAP值与沃德法筛选出15个关键特征变量,降低模型输入维度;最后,引入Halton低差异序列优化遗传算法初始种群分布,并利用遗传算法实现XGBoost模型的超参寻优。实证结果表明,SHAP-GA-XGBoost融合模型在E_(MAE)、E_(MAPE)等指标上显著优于BP、SVM、LSTM、LSSVM等对比模型,验证了特征工程与算法优化协同的有效性。 展开更多
关键词 shap方法 遗传算法 极限梯度提升模型 公路货运量
在线阅读 下载PDF
基于贝叶斯优化XGBoost-SHAP模型的湖南省麻阳县滑坡易发性评价及其可解释性分析
14
作者 罗鹏 凌跃新 陈迪 《华南地质》 2025年第3期644-656,共13页
在滑坡易发性评价工作中,机器学习模型(如随机森林、梯度提升树、神经网络等)因其可以融合多源数据并处理复杂非线性关系而得到了广泛的应用,但模型决策过程的不透明仍是机器学习模型在滑坡易发性评价中应用仍面临的重要挑战。目前,在... 在滑坡易发性评价工作中,机器学习模型(如随机森林、梯度提升树、神经网络等)因其可以融合多源数据并处理复杂非线性关系而得到了广泛的应用,但模型决策过程的不透明仍是机器学习模型在滑坡易发性评价中应用仍面临的重要挑战。目前,在机器学习模型构建过程中集成可解释分析是揭示模型决策机制从而提高模型透明度的研究方向之一。本文以湖南省麻阳县为研究区,通过XGBoost机器学习算法结合贝叶斯优化算法构建滑坡易发性评价模型,利用混淆矩阵及接受者操作特征曲线开展评价精度验证,以自然断点法对模型的滑坡发生概率进行划分得到滑坡易发性区划图,再结合SHAP(Shapley Additive exPlanations)揭示各影响因子对滑坡发生概率的影响程度,增强模型可信度与可解释性。结果表明,优化后XGBoost模型AUC值(0.8101)相较于初始的XGBoost模型AUC值(0.7974)有一定程度的提升,但优化效果较有限;滑坡极高-高易发区主要集中在研究区的中部和东部,特别是锦江两岸白垩系分布的低丘地区;SHAP特征摘要图揭示了不同特征值对滑坡发育有明显差异,高程、距道路距离和距河流距离是研究区滑坡发育的主要影响因子,对滑坡发育贡献显著。 展开更多
关键词 XGBoost模型 机器学习 shap 易发性评价 麻阳县
在线阅读 下载PDF
基于多模型SHAP融合的5G基站能耗预测研究
15
作者 李林禹 王洁丽 +2 位作者 孟德香 刘智勇 王沁 《电信工程技术与标准化》 2025年第S1期282-287,共6页
随着高效网络管理与能耗监测需求的不断增长,5G无线网络中基于业务特征与能耗指标之间关系的预测建模研究日益受到关注。本文聚焦于分析小区的业务特征与其能耗之间的关联性,采用先进的机器学习算法XGBoost、LightGBM和CatBoost构建多... 随着高效网络管理与能耗监测需求的不断增长,5G无线网络中基于业务特征与能耗指标之间关系的预测建模研究日益受到关注。本文聚焦于分析小区的业务特征与其能耗之间的关联性,采用先进的机器学习算法XGBoost、LightGBM和CatBoost构建多个预测模型以挖掘这种关联。本文的核心创新点在于引人了基于多模型的SHAP值融合方法,实现了对特征重要性更稳健且一致的解释。通过融合不同模型的SHAP输出,有效减少了单一模型带来的解释偏差,从而获得了更具通用性的业务特征对能耗影响的洞察。研究结果深化了对蜂窝网络中业务行为与能耗关系的理解,并为运营商在网络优化与节能管理方面提供了数据驱动的决策支持。 展开更多
关键词 5G无线网络 集成算法 能耗预测 shap
在线阅读 下载PDF
融合XGBoost与SHAP模型的足球运动员身价预测及特征分析方法 被引量:10
16
作者 廖彬 王志宁 +1 位作者 李敏 孙瑞娜 《计算机科学》 CSCD 北大核心 2022年第12期195-204,共10页
随着足球运动全球化程度的不断提升,全球转会市场愈发庞大,然而针对影响转会交易最关键的因素球员身价的深入模型及应用研究还较为缺乏。以国际足球联合会FIFA的官方球员数据库为研究对象,首先,在区分不同球员位置的前提下,运用Box-Cox... 随着足球运动全球化程度的不断提升,全球转会市场愈发庞大,然而针对影响转会交易最关键的因素球员身价的深入模型及应用研究还较为缺乏。以国际足球联合会FIFA的官方球员数据库为研究对象,首先,在区分不同球员位置的前提下,运用Box-Cox变换、F-Score特征选择等方法对原始数据集进行特征处理;其次,通过XGBoost构建球员身价预测模型,并与Random Forest,Adaboost,GBDT,SVR等主流机器学习算法进行10折交叉验证实验对比,证明了XGBoost模型在R2,MAE,RMSE这3项指标上的性能优势;最后,在身价预测模型的基础上,融合SHAP框架分析不同位置影响球员身价的重要因素,为球员身价评估、身价对比分析、球员训练策略制定等场景提供决策支持。 展开更多
关键词 机器学习 球员身价预测 训练策略 XGBoost算法 shap
在线阅读 下载PDF
SHAP分析指导的早期损伤时间可解释推断模型构建 被引量:2
17
作者 吕慧敏 刘明锋 +5 位作者 靳茜茜 张艺博 安国帅 杜秋香 王英元 孙俊红 《中国法医学杂志》 CSCD 2024年第3期320-326,共7页
目的 为解决损伤时间推断模型法医实践性不强、可解释性缺乏的问题,应用SHAP算法构建特征可解释机器学习模型,为损伤时间推断提供新策略。方法 基于前期发现与骨骼肌损伤时间密切相关的35个基因相对表达量,利用多层感知器(Multilayer Pe... 目的 为解决损伤时间推断模型法医实践性不强、可解释性缺乏的问题,应用SHAP算法构建特征可解释机器学习模型,为损伤时间推断提供新策略。方法 基于前期发现与骨骼肌损伤时间密切相关的35个基因相对表达量,利用多层感知器(Multilayer Perceptron,MLP)、随机森林(Random Forest,RF)、LightGBM(LGBM)和支持向量机(Support Vector Machine,SVM)4种算法构建损伤时间推断模型。应用SHAP(SHapley Additive exPlanation)算法对模型进行基因特征重要性排序,剔除冗余特征,比较并获得损伤时间推断最优模型。基于SHAP的局部解释对最优模型提取到的基因特征进行了个性化评估和分析。结果 经过SHAP特征筛选后,MLP算法表现最佳。仅用15个基因特征,就能准确预测损伤时间段为4 h~12 h、16 h~24 h、28 h~36 h、40 h~48 h,受试者工作特征曲线下面积(Area Under the Curve,AUC)为0.99。SHAP结果显示与损伤时间推断最相关的基因是Fam210a。局部分析进一步揭示了Fam210a基因的高水平表达有助于增加4 h~12 h的预测概率;Rae1基因的高水平表达有助于增加16 h~24 h的预测概率;Tbx18基因的低水平表达有助于增加28 h~36 h的预测概率;Tbx18基因的高水平表达有助于增加40 h~48 h的预测概率。结论 MLP结合SHAP构建的损伤时间推断模型能准确预测损伤时间。此外,使用SHAP可解释器能够更好的理解模型中特征基因对模型预测的贡献度,为进一步深入研究损伤时间奠定基础。 展开更多
关键词 法医病理 损伤时间推断 机器学习模型 shap 特征解释
原文传递
基于随机森林模型与SHAP算法的渝东北烟区土壤交换酸含量影响因素分析研究 被引量:4
18
作者 李昕容 杨超 +2 位作者 张鑫 周亚男 刘洪斌 《中国烟草学报》 CAS CSCD 北大核心 2024年第2期52-60,共9页
【背景和目的】土壤交换酸含量在农业生产中对于指导施肥和调节土壤pH具有重要作用,研究环境因子(气候、地形、成土母岩)和种植年限对土壤交换酸(Exchangeable Acidity, EA)含量的影响。【方法】以重庆市东北烟区为研究区,对该区中483... 【背景和目的】土壤交换酸含量在农业生产中对于指导施肥和调节土壤pH具有重要作用,研究环境因子(气候、地形、成土母岩)和种植年限对土壤交换酸(Exchangeable Acidity, EA)含量的影响。【方法】以重庆市东北烟区为研究区,对该区中483个采样点的土壤交换酸数据进行统计分析,构建随机森林(Random Forest, RF)模型并结合Shapley Additive exPlanations(SHAP)算法,探讨影响土壤交换酸含量的主控因素。【结果】(1)研究区土壤交换酸含量在1.56~27.50 cmol/kg之间,与降水、日照时数、坡向、种植年限呈极显著负相关性。二叠系石灰岩发育的土壤交换酸含量显著高于三叠系石灰岩发育的土壤。(2)RF模型可解释土壤交换酸含量空间变异的64%,影响因子对土壤交换酸含量的重要性为气候>成土母岩>种植年限>地形。(3)SHAP算法揭示了土壤交换酸含量在不同气候条件下存在明显的阈值效应。当年均降水量、日照时数和均温分别超过1250 mm、1290 h和12℃时,会导致土壤交换酸含量的减少,反之则会促使其增加。【结论】气候是影响土壤交换酸含量变异最重要的环境因素,其中降水和日照时数是最重要的气候因子,研究结果可为烟田土壤酸化管理调控提供参考。 展开更多
关键词 土壤交换酸 环境因子 随机森林 shap算法 阈值
在线阅读 下载PDF
基于多源数据和Stacking-SHAP方法的山地丘陵区土地覆被分类 被引量:10
19
作者 周亚男 陈绘 刘洪斌 《农业工程学报》 EI CAS CSCD 北大核心 2022年第23期213-222,共10页
山地丘陵区地形复杂,地表辐射信号畸变严重,地物识别困难。为准确提取山区地物信息,结合多源异构数据,Stacking集成学习和shapley addictive explanation(SHAP)方法展开土地覆被分类研究。从Sentinel-1/2影像、气候数据、土壤数据和数... 山地丘陵区地形复杂,地表辐射信号畸变严重,地物识别困难。为准确提取山区地物信息,结合多源异构数据,Stacking集成学习和shapley addictive explanation(SHAP)方法展开土地覆被分类研究。从Sentinel-1/2影像、气候数据、土壤数据和数字高程图中提取遥感、气候、土壤和地形四类特征变量,设计多种变量组合方案,结合Stacking算法,探讨不同类型变量在山区地物识别中的效用,并对比Stacking最佳方案与支持向量机(Support Vector Machine,SVM)、随机森林(Random Forest,RF)和极端梯度回归(eXtreme Gradient Boosting,XGBoost)算法的分类精度,评价Stacking方法在山区地物信息提取中的性能。同时,引入SHAP方法,量化Stacking模型中各特征变量的重要性。结果表明:在仅以遥感变量为基础方案时,山区土地覆被分类精度最低;在分别加入气候、土壤和地形变量后,总体精度、Kappa系数和F1分数均有所提高,其中旱地、水田和园地分类精度的提升幅度较大。基于Stacking算法结合所有类型特征变量的方案达到了最佳的分类精度,其总体精度、Kappa系数和F1分数分别为96.61%、0.96和94.81%,分类精度优于相同特征下的SVM、RF和XGBoost。SHAP方法可量化Stacking模型中特征变量的全局以及局部重要性,明确各变量对不同地物类型识别的相对贡献,为山区土地覆被分类的变量选择及优化提供有价值的信息。该研究可为机器学习协助复杂景观地区土地覆被制图研究提供技术支持和理论参考。 展开更多
关键词 遥感 多源数据 土地覆被分类 Stacking算法 shap方法 山地丘陵区
在线阅读 下载PDF
基于LightGBM与SHAP的信贷违约预测方法研究 被引量:2
20
作者 戴峥琪 雷亿辉 +1 位作者 彭晨 夏广萍 《邵阳学院学报(自然科学版)》 2024年第1期84-91,共8页
机器学习方法在信贷领域取得了较好的成果,但由于缺乏可解释性,应用受到限制,为增加其可信度和透明度,克服“黑盒”模型缺乏可解释性的缺陷,基于LightGBM算法建立信贷违约预测模型,并设计SHAP算法对模型的结果进行解释。结果表明,模型... 机器学习方法在信贷领域取得了较好的成果,但由于缺乏可解释性,应用受到限制,为增加其可信度和透明度,克服“黑盒”模型缺乏可解释性的缺陷,基于LightGBM算法建立信贷违约预测模型,并设计SHAP算法对模型的结果进行解释。结果表明,模型性能更好,预测精度更高,其精度高达88.61%;SHAP算法解释结果表明“信用组合的分类”“要支付的剩余债务”“每月EMI付款”等因素对信贷决策有着重要影响。 展开更多
关键词 信贷风险 LightGBM算法 shap算法 可解释性
在线阅读 下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部