期刊文献+
共找到99篇文章
< 1 2 5 >
每页显示 20 50 100
新型炎症指数对老年重症心力衰竭患者近期死亡风险的预测价值:基于SHAP算法的可解释性分析
1
作者 张婷 陈睿 曹文斋 《中华保健医学杂志》 2026年第1期5-10,共6页
目的 构建可解释性机器学习模型,预测老年重症心力衰竭患者短期死亡风险,并探讨新型炎症指数的预测价值。方法回顾性分析MIMIC-IV 3.1数据库中诊断为心力衰竭的老年重症患者1994例,按7∶3的比例随机分为训练集和测试集。采用6种机器学... 目的 构建可解释性机器学习模型,预测老年重症心力衰竭患者短期死亡风险,并探讨新型炎症指数的预测价值。方法回顾性分析MIMIC-IV 3.1数据库中诊断为心力衰竭的老年重症患者1994例,按7∶3的比例随机分为训练集和测试集。采用6种机器学习方法建立预测模型,包括logistic回归(LR)、决策树(DT)、随机森林(RF)、自适应增强(AdaBoost)、轻量梯度提升(LightGBM)、高斯朴素贝叶斯(NB)。模型效能通过受试者工作特征(ROC)曲线、精确率-召回率(P-R)曲线、校准曲线评估。采用SHAP进行模型解释并筛选核心炎症指数,通过ROC曲线确定最佳临界值。结果本研究共纳入1994例老年重症心力衰竭患者,28 d内死亡253例(12.7%),存活1741例(87.3%)。经初筛,纳入65个临床特征用于机器学习模型构建。结果显示LightGBM模型展现出最佳的预测性能,ROC曲线下面积(AUC)为[0.897(0.881~0.909)],P-R曲线的平均精度(AP)为0.86,校准曲线显示预测概率与实际观察结果一致。SHAP值分析揭示急性生理学评分Ⅲ(APSⅢ)、格拉斯哥昏迷评分(GCS)、单核细胞与淋巴细胞比值(MLR)、呼吸频率(RR)、年龄、血尿素氮、牛津急性疾病严重度评分(OASIS)、血管紧张素转化酶抑制剂(ACEI)、中性粒细胞与淋巴细胞比值(NLR)、营养风险指数(NRI)是重要的影响因素。ROC曲线分析MLR、NLR的AUC分别为0.682、0.667,以0.426、7.083为截断值,敏感度为0.747、0.751,特异度为0.529、0.503。结论LightGBM模型可较好地预测老年重症心力衰竭患者短期死亡风险,以NLR、MLR为代表的新型炎症指数对老年心力衰竭患者短期死亡风险分层具有潜在临床应用价值。 展开更多
关键词 心力衰竭 死亡风险 单核细胞与淋巴细胞比值 中性粒细胞与淋巴细胞比值 shap算法
暂未订购
基于XGBoost-SHAP算法的夏热冬冷地区住宅建筑碳排放时空演变及影响因素研究
2
作者 么智 《环境工程技术学报》 北大核心 2026年第1期83-99,共17页
为系统探究夏热冬冷地区住宅建筑碳排放的时空演变规律及其驱动机制,利用2007—2021年九省市的面板数据,采用Slope值、泰尔指数及标准差椭圆等方法探究碳排放的时空特征,结合经贝叶斯超参数优化的XGBoost-SHAP框架,分析该地区碳排放的... 为系统探究夏热冬冷地区住宅建筑碳排放的时空演变规律及其驱动机制,利用2007—2021年九省市的面板数据,采用Slope值、泰尔指数及标准差椭圆等方法探究碳排放的时空特征,结合经贝叶斯超参数优化的XGBoost-SHAP框架,分析该地区碳排放的驱动机制差异。结果发现:碳排放总量从2007年的185.64百万t增至2021年的334.61百万t,增速呈现显著的阶段性特征;空间分布呈现出显著的上下游梯度特征及南北向集聚、东西向发散的演化趋势,区域内差异贡献率持续超过90%;影响维度的作用大小为人口规模>技术水平>经济发展>建筑属性>政策支持>气候特征,上、中、下游地区分别呈现“能源主导型”“人口主导型”和“能源经济双轮驱动型”的差异化发展模式,各影响因素普遍存在显著的非线性效应和临界特征。针对区域差异,提出构建“三层联动”的区域协同机制,实施“双轨并进”“精细化管理”和“系统集成”的差异化减排策略。 展开更多
关键词 夏热冬冷地区 住宅建筑 碳排放 时空演变 XGBoost-shap算法
在线阅读 下载PDF
基于可解释机器学习与SHAP值的精神分裂症患者攻击行为风险预测研究
3
作者 吴青青 沈藕英 陈琳霞 《医院管理论坛》 2026年第1期65-71,共7页
目的通过可解释的机器学习(ML)技术,提高对精神分裂症患者攻击行为风险的预测准确性。方法选取我院2022年1月—2024年6月间收治的529例精神分裂症患者作为研究对象。通过Boruta筛选患者攻击行为特征,以3∶2比例随机分为317例训练集和21... 目的通过可解释的机器学习(ML)技术,提高对精神分裂症患者攻击行为风险的预测准确性。方法选取我院2022年1月—2024年6月间收治的529例精神分裂症患者作为研究对象。通过Boruta筛选患者攻击行为特征,以3∶2比例随机分为317例训练集和212例测试集,8种ML模型10倍交叉验证。结果Boruta算法筛选出8个重要特征变量,包括CTQ-SF、BPRS、HDL、SES、MLR、PANSS阳性症状评分、PANSS一般精神病理评分和PLR。其中,XGBoost模型在ROC曲线中的AUC值最高。CTQ-SF、BPRS和HDL是预测攻击行为风险最重要的三个特征变量。结论XGBoost模型在预测攻击行为风险方面具有较高的准确性和临床价值,通过SHAP值解释,提升了模型的透明性和解释性,有助于临床医生更好地理解模型预测结果。 展开更多
关键词 精神分裂症 机器学习 Boruta算法 shapley加性解释 风险预测
暂未订购
基于RFE-SHAP的具有可解释性纱线质量预测研究
4
作者 张保威 郭智林 王永华 《棉纺织技术》 2026年第1期2-9,共8页
为优化纱线质量预测的特征选择过程,进一步消除小样本环境下存在的冗余特征,提高后续预测过程的准确性、可靠性,提出了一种基于结合递归特征消除算法(RFE)和SHAP的具有可解释性的纱线质量预测方法,即RFE⁃SHAP。首先,选择RFE作为迭代特... 为优化纱线质量预测的特征选择过程,进一步消除小样本环境下存在的冗余特征,提高后续预测过程的准确性、可靠性,提出了一种基于结合递归特征消除算法(RFE)和SHAP的具有可解释性的纱线质量预测方法,即RFE⁃SHAP。首先,选择RFE作为迭代特征选择方法,将支持向量回归(SVR)作为其评估器;然后,引入SHAP技术去量化原始特征对纱线强力及毛羽H值两种纱线质量指标的边际贡献值,从而辅助特征选择,进而提供更直观且解释性更强的特征选择策略;最后,结合神经网络构建纱线强力以及毛羽H值的预测模型。试验结果证明:经RFE⁃SHAP算法得到的最优特征子集作为纱线强力及毛羽H值预测模型的输入时,模型多个评价指标的效果均有提升,其中,对两种纱线质量指标预测的平均绝对百分比误差均未超过3%。认为:该方法具有较高的可行性,可以在一定程度上提高模型的预测性能。 展开更多
关键词 纱线质量预测 特征选择 递归特征消除算法 支持向量回归 shap技术
在线阅读 下载PDF
基于XGBoost⁃SHAP方法的建设项目碳排放空间异质性分析 被引量:4
5
作者 王元庆 李佳玥 +1 位作者 刘备 王芳 《环境科学》 北大核心 2025年第7期4090-4100,共11页
为使公路建设碳减排更有效,聚焦高速公路建设过程中的碳排放空间异质性,基于广东省A高速公路项目40个分段样本筛选出的构造物类型、桥隧比、设计坡度、路线长度、填方量、挖方量和水泥消耗量这7个碳排放影响关键指标,训练与验证了XGBoos... 为使公路建设碳减排更有效,聚焦高速公路建设过程中的碳排放空间异质性,基于广东省A高速公路项目40个分段样本筛选出的构造物类型、桥隧比、设计坡度、路线长度、填方量、挖方量和水泥消耗量这7个碳排放影响关键指标,训练与验证了XGBoost碳排放预测模型,构建了解释这40个路段碳排放空间异质性的SHAP算法,研究了路段特征对碳排放的影响、总特征贡献和特征交互效应.结果表明,水泥消耗量的增加对碳排放的非线性增长贡献最大,路线长度、挖方量和桥隧比对碳排放的贡献度也较为显著;冷热点分析发现坡度高于2.5%且地形复杂的路段碳排放趋高,存在聚集效应;XGBoost-SHAP模型较地理加权回归模型GWR能更清晰解释碳排放的空间分布特征及其影响因素,在捕捉关键碳源和理解碳排放空间分布特征方面表现更佳.基于以上发现,提出了公路建养碳减排的针对性综合策略,以推动公路建设的可持续发展. 展开更多
关键词 碳排放 空间异质性 XGBoost算法 shap算法 可解释性
原文传递
基于LightGBM和SHAP算法的致密油储层孔隙度预测 被引量:2
6
作者 王伟 党海龙 +3 位作者 康胜松 肖前华 丁磊 石立华 《油气地质与采收率》 北大核心 2025年第5期90-99,共10页
为了准确高效地表征致密油储层孔隙度的空间分布特征,同时对机器学习模型的可解释性进行评价,采用Z-Score方法对特征属性进行归一化处理,并应用Optuna超参数优化框架对模型的超参数进行调优,建立了一种基于LightGBM算法的孔隙度预测模型... 为了准确高效地表征致密油储层孔隙度的空间分布特征,同时对机器学习模型的可解释性进行评价,采用Z-Score方法对特征属性进行归一化处理,并应用Optuna超参数优化框架对模型的超参数进行调优,建立了一种基于LightGBM算法的孔隙度预测模型,与GBDT和XGBoost算法模型进行了预测效果的综合对比,并利用SHAP算法对LightGBM模型的输出结果进行了可视化解释分析。研究结果表明:LightGBM模型在训练数据集和测试数据集上的预测决定系数分别为0.984和0.855,模型预测准确度高、泛化能力强,综合预测效果好于GBDT和XGBoost模型。应用SHAP算法对LightGBM模型结果的可解释性进行分析,结果表明,影响LightGBM孔隙度预测模型最重要的5项测井参数为密度、阵列感应电阻率、自然伽马、声波时差和光电吸收截面指数。在研究区某单井X致密层段孔隙度的预测实例中,LightGBM模型预测准确度达93.9%,分别高于GBDT和XGBoost模型的预测准确度86.53%和89.08%;训练时长为0.016 s,分别为GBDT和XGBoost模型训练时长的0.096倍和0.025倍;预测时长为0.01 s,分别为GBDT和XGBoost模型预测时长的0.42倍和0.19倍;LightGBM模型的预测效率相对GBDT和XGBoost模型具有明显优势,其在取心井段上对孔隙度的预测误差更小,预测能力更强,且能更好地拟合低值孔隙度。该方法的应用不仅解决了单井致密层段获取完整准确孔隙度分布的难题,而且提高了孔隙度预测的精度和效率,对致密油储层的评价及高效勘探开发具有一定的参考价值。 展开更多
关键词 致密油储层 机器学习 LightGBM算法 shap算法 孔隙度预测
在线阅读 下载PDF
一种兼具精度与可解释性的Stacking-SHAP滑坡易发性预测集成方法 被引量:1
7
作者 黄鑫 叶健 +3 位作者 刘骋冰 曾秋雨 郭万新 郭志凯 《测绘学报》 北大核心 2025年第10期1826-1840,共15页
滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性... 滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性预测的准确性与诱因分析的可靠性。本文方法采用Stacking集成框架,融合XGBoost、CatBoost、LightGBM、逻辑回归(LR)、随机森林(RF)等多种机器学习分类器,在保证预测精度的基础上,引入SHAP(shapley additive explanations)算法,以增强模型的可解释性。试验结果表明,Stacking-SHAP模型的AUC值达到0.920,显著优于单一分类器模型,如XGBoost(0.893)、CatBoost(0.894)、LightGBM(0.879)、RF(0.859)和LR(0.794)。更重要的是,相较于SHAP集成单一机器学习模型,Stacking-SHAP可解释增强集成模型在滑坡诱因分析方面表现出更优的综合性能,提高了滑坡致灾因素分析的可信度。整体而言,本文方法兼具高精度预测与高可靠性解释,为滑坡易发性预测与诱因分析提供了一种创新性方法,在滑坡防治与减灾领域具有重要的理论与应用价值。 展开更多
关键词 滑坡易发性 地理大数据 Stacking算法 shap算法 滑坡诱因分析
在线阅读 下载PDF
基于分层时空框架的共享单车需求预测:LP-TFT模型与SHAP可解释分析
8
作者 李聪颖 袁锴璐 +3 位作者 李静怡 郑晓晶 李坤 何源 《中国公路学报》 北大核心 2025年第10期305-323,共19页
为揭示共享单车系统需求演变规律,并明确不同因素对需求的影响,提出一种融合特征解耦与深度学习的集群-站点级分层时空预测框架。首先,基于站点间的关联性与相似性改进LP算法,构建站点集群划分模型,其中关联性通过空间距离与出行流量表... 为揭示共享单车系统需求演变规律,并明确不同因素对需求的影响,提出一种融合特征解耦与深度学习的集群-站点级分层时空预测框架。首先,基于站点间的关联性与相似性改进LP算法,构建站点集群划分模型,其中关联性通过空间距离与出行流量表征,相似性通过POI相似度与历史出行量相似度加权表征;引入借还不平衡差异指数评价聚类效果,以最小化借还不平衡差异指数为目标进行站点集群划分;在此基础上,分别建立基于TFT模型的集群级与站点级需求预测模型,并将集群级预测结果整合进站点级预测过程中;最后,运用SHAP方法解析不同因素对集群级与站点级共享单车需求的影响机制。研究结果表明:集群级需求预测过程中,小时特征对集群级需求的影响最显著,表现为夜间抑制、日间促进,气象因素呈现双向调节作用,在温度适中、气压较高、风速与湿度较低时对需求产生促进作用;站点级需求预测过程中,集群需求为核心影响因素,随着集群级结果的引入,站点级预测结果的决定系数R^(2)由0.7679提升至0.8504,平均绝对误差MAE由1.2152降至0.9755,误差降低约19.73%;气象因素在站点层级展现出一定的独立影响趋势,如在部分低温、高湿或风速较大的情境下仍可能促进需求,表明站点级需求不仅依赖于集群需求的整体波动,还受站点周边环境的影响,具有一定独立性。研究构建了基于分层时空框架的共享单车需求预测方法,可为共享单车需求驱动因素识别与动态调度提供决策支持。 展开更多
关键词 交通工程 共享单车需求预测 LP算法 TFT算法 shap可解释分析
原文传递
基于E5-SHAP算法的可解释英语作文自动评分语言模型
9
作者 王兵 单瑞雪 +1 位作者 邢海燕 李盼池 《智能科学与技术学报》 2025年第3期370-380,共11页
针对英语作文自动评分系统因依赖复杂深度学习模型而缺乏可解释性的问题,提出了一种基于E5-SHAP算法的可解释英语作文自动评分模型。该模型基于E5-Base模型编码器提取文本特征,结合均值计算和回归层实现评分输出,并引入自适应加权机制,... 针对英语作文自动评分系统因依赖复杂深度学习模型而缺乏可解释性的问题,提出了一种基于E5-SHAP算法的可解释英语作文自动评分模型。该模型基于E5-Base模型编码器提取文本特征,结合均值计算和回归层实现评分输出,并引入自适应加权机制,从语法、句法、词汇多样性等6个维度综合评估作文质量。模型采用LoRA微调技术优化特定层参数,提高对作文特征的适应性。通过SHAP算法计算各特征对最终评分的影响,从而提供清晰的评分依据和解释路径,提升评分过程的透明性和可信度。实验结果表明,与现有模型相比,该模型在ELLIPSE数据集和自建数据集上的表现均有所提升,二次加权卡帕值(QWK)达0.84,在准确性和可解释性上优于现有模型。 展开更多
关键词 英语作文 自动评分模型 E5-shap算法 可解释性
原文传递
基于特征选择的SHAP-Transformer高炉铁水硅含量预报模型 被引量:4
10
作者 马居安 郑华伟 +4 位作者 刘栋梁 陆昊 周进东 毕学工 熊玮 《钢铁》 北大核心 2025年第8期68-78,共11页
数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal c... 数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal component analysis,PCA)将22个分钟级的特征参数转化为铁次级参数,进一步采用滑动窗口和最大信息系数(maximal information coefficient,Cimax)确定了参数的滞后时长。利用随机森林优化的SHAP算法对34个参数在强耦合条件下的重要性进行评估,筛选出7个关键参数。使用SHAP算法优化Transformer的自注意力机制,构建了SHAP-Transformer铁水硅含量预报模型,通过现场数据验证了模型的有效性。结果表明,铁水硅质量分数预测误差为-0.05~0.05和-0.1~0.1时,基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型的命中率最高,分别为72.12%和95.76%,比基于MIC参数选择的SHAP-Transformer模型提高了26.67%和21.21%,比基于滑动窗口时滞分析及耦合参数优选的长短时记忆网络(long short-term memory,LSTM)模型提高了17.57%和9.7%。基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型对铁水硅含量的变化趋势预测也有较高的精度,趋势方向预测的准确率为87.3%,趋势类别预测的准确率为60.5%,研究能够为高炉操作者提前判断炉温变化提供可靠依据。 展开更多
关键词 高炉 铁水硅含量 特征选择 时滞分析 随机森林 shap算法 炼铁 预报模型
原文传递
基于机器学习和SHAP算法的声波测井曲线重构及可解释性分析 被引量:9
11
作者 黎子豪 蒋恕 《地质科技通报》 北大核心 2025年第1期321-331,共11页
测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间... 测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间的关系模型使得曲线重构精度相对较低,机器学习算法虽能在大量数据之间找到最为合适的数据映射关系进而提高模型精度,但相较而言其所构建的黑箱模型无法得到良好的解释。近期,可解释性算法的运用使得机器学习在重构测井曲线中的应用更为合理。通过将支持向量回归(support vector regression,简称SVR),随机森林(random forest,简称RF)以及极限梯度提升(extreme gradient boosting,简称XGBoost)和传统多元线性回归方法(linear regression,简称LR)的对比对英国能源局22-30b-11号井声波测井曲线进行了模型重构并基于shapley additive explanations(SHAP)算法对XGBoost模型进行了解释。结果表明,XGBoost在测试集上的决定系数(R2)和均方误差(MSE)分别为0.996,6.371,优于SVR的0.990、15.755和RF的0.993、9.871,而传统多元线性回归方法则为0.969、48.895,表明XGBoost对声波时差曲线的重构具有更高的准确度和更好的泛化性能。创新性地采用SHAP算法对XGBoost黑箱模型的解释表明,在模型构建选择重要特征时,XGBoost模型采用地层温度数据作为特征明显合理于多元线性回归方法采用的井径测井数据。最后基于SHAP对模型进行了单点和全局特征交互解释。上述结果表明在声波测井曲线重构方面,机器学习算法明显优于传统的多元线性回归方法,并证明了SHAP算法在声波测井曲线重构机器学习模型解释方面的可行性,为后续机器学习在测井解释中的发展提供了新的思路。 展开更多
关键词 测井曲线重构 机器学习 模型解释 shap算法 声波测井
在线阅读 下载PDF
基于TPE-SVM模型和SHAP解释的闪锌矿微量元素特征识别铅锌矿床类型 被引量:1
12
作者 陈忠元 任涛 赵冻 《地球科学》 北大核心 2025年第11期4355-4369,共15页
为了解闪锌矿微量元素特征对不同成因矿床类型是否能够进行有效判别,系统收集了全球典型的沉积喷流型(SEDEX)、密西西比河谷型(MVT)、火山块状硫化物型(VMS)、矽卡岩型(skarn)和浅成低温热液型(epithermal)铅锌矿床中3117条闪锌矿的12... 为了解闪锌矿微量元素特征对不同成因矿床类型是否能够进行有效判别,系统收集了全球典型的沉积喷流型(SEDEX)、密西西比河谷型(MVT)、火山块状硫化物型(VMS)、矽卡岩型(skarn)和浅成低温热液型(epithermal)铅锌矿床中3117条闪锌矿的12种微量元素含量数据(Mn、Fe、Co、Cu、Ga、Ge、Ag、Cd、In、Sn、Sb、Pb),使用基于Tree-structured Parzen Estimator(TPE)优化的支持向量机机器学习算法建立了闪锌矿微量元素分类模型,并使用SHAP(SHapley Additive exPlanations)方法进行特征重要性分析.结果表明,经优化的TPE-SVM模型在测试集上展现出优异的分类能力,准确率、召回率和F1值均超过0.97.通过SHAP解释发现闪锌矿中Mn、Ge、Co为矿床成因类型判别三大关键元素.本文建立的闪锌矿微量元素判别指标体系,不仅为矿床成因鉴定提供了新的技术手段,更可为复合成矿系统解析、隐伏矿体预测等复杂地质问题提供创新解决方案. 展开更多
关键词 闪锌矿 微量元素 机器学习 TPE优化算法 shap算法 矿床地质
原文传递
基于路径规划数据与RF-SHAP算法的湘西州乡村教育设施可达性及其影响因素研究 被引量:1
13
作者 李光宇 丁国胜 +2 位作者 何韶瑶 屈野 张梦淼 《西部人居环境学刊》 北大核心 2025年第4期115-121,共7页
教育设施可达性是表征乡村地区教育水平的重要维度。以湘西土家族苗族自治州为例,基于高德地图开放平台路径规划数据服务,建构一个获取区域内“村庄—教育设施”的最短路径时间的系统运行方案,精准、高效测度乡村地区教育设施可达性水... 教育设施可达性是表征乡村地区教育水平的重要维度。以湘西土家族苗族自治州为例,基于高德地图开放平台路径规划数据服务,建构一个获取区域内“村庄—教育设施”的最短路径时间的系统运行方案,精准、高效测度乡村地区教育设施可达性水平。运用克里金插值、空间自相关等方法分析乡村地区教育设施可达性水平的空间格局总体特征和空间集聚特征,运用随机森林模型与SHAP方法(RF-SHAP算法)探索设施可达性影响因素及非线性关系。结果表明:湘西乡村教育设施可达性总体水平欠佳;在各县域中形成了以县城中心向外围逐渐降低的乡村教育设施可达性水平空间分布特征且集聚特征差异显著;其关键影响因素主要包括人口密度、建设用地比率和平均高程,反映了城镇化水平与自然环境特征对可达性水平具有非线性影响。研究对推动实现脱贫地区城乡公共服务均等化具有重要理论与现实意义。 展开更多
关键词 路径规划 RF-shap算法 乡村教育设施 可达性 影响因素
在线阅读 下载PDF
良性前列腺增生并发膀胱结石的危险因素分析及基于SHAP的可解释性预测模型构建
14
作者 赵欢 欧阳松 +1 位作者 董洪超 王勤章 《现代泌尿外科杂志》 2025年第8期653-661,共9页
目的探讨良性前列腺增生(BPH)患者并发膀胱结石(BS)的独立危险因素,构建预测模型和部署便于使用的网站。方法回顾性分析2022年1月—2025年1月石河子大学第一附属医院泌尿外科收治的460例BPH患者的临床资料,通过单因素逻辑回归结合Borut... 目的探讨良性前列腺增生(BPH)患者并发膀胱结石(BS)的独立危险因素,构建预测模型和部署便于使用的网站。方法回顾性分析2022年1月—2025年1月石河子大学第一附属医院泌尿外科收治的460例BPH患者的临床资料,通过单因素逻辑回归结合Boruta算法共同识别训练集患者中BPH并发BS的独立危险因素,并基于危险因素构建列线图模型。通过受试者工作特征(ROC)曲线、灵敏度、特异度、阳性预测值(PPV)、阴性预测值(NPV)、F1指数、校准曲线和临床决策曲线(DCA)综合评价模型预测效能;使用SHAP算法评估不同变量对BPH并发BS的贡献度。并基于预测模型建立便于使用的网页。结果460例BPH患者中并发BS者144例(31.3%)。单因素逻辑回归结合Boruta算法共识别出中性粒细胞占比、尿培养结果、膀胱内前列腺突出度(IPP)、尿亚硝酸盐检测结果、尿白细胞检测结果和尿潜血结果6个独立危险因素。测试集中,该列线图的ROC曲线下面积为0.887(95%CI:0.816~0.947),灵敏度、特异度、PPV、NPV和F1指数分别为0.705、0.968、0.912、0.876和0.795,校准曲线和DCA均展示出良好的区分能力和临床应用能力。SHAP结果显示IPP、尿白细胞检测结果、尿培养结果、中性粒细胞占比、尿亚硝酸盐检测结果和尿潜血结果是BPH并发BS最重要的危险因素。最终建立可公开访问的BPH并发BS诊断的网站(https://wutiaowu2.shinyapps.io/bladderrrr/)。结论中性粒细胞占比、尿培养结果、IPP、尿亚硝酸盐检测结果、尿白细胞检测结果和尿潜血结果是BPH并发BS的独立影响因素,基于此构建的模型及网页易用且准确度高,具有较高的临床实用价值。 展开更多
关键词 前列腺增生 膀胱结石 列线图 预测模型 shap算法
暂未订购
基于XGBoost与SHAP分析的可解释性故障诊断方法研究
15
作者 李开平 张凤丽 +1 位作者 黄祖广 王金江 《制造技术与机床》 北大核心 2025年第6期199-208,共10页
针对现有智能故障诊断方法存在特征输入单一、故障难以提取、模型可解释性较差等问题,提出一种基于XGBoost(extreme gradient boosting)与SHAP(SHapley Additive exPlanations)分析的可解释性故障诊断方法。首先,采用传统信号处理方法... 针对现有智能故障诊断方法存在特征输入单一、故障难以提取、模型可解释性较差等问题,提出一种基于XGBoost(extreme gradient boosting)与SHAP(SHapley Additive exPlanations)分析的可解释性故障诊断方法。首先,采用传统信号处理方法完成多域特征的提取。其次,基于XGBoost集成算法构建故障诊断模型,并根据XGBoost内嵌评估指标对模型进行初步特征解释。最后,运用Tree SHAP方法对诊断模型进行特征解释分析,探究重要特征对轴承故障类别趋势的影响关系,分析特征之间的依赖交互效应,直观、透明地揭示模型的诊断机制。通过实验对比XGBoost与其他传统机器学习方法,本模型在多维评价指标中综合表现更为突出,且具有较强的精确性,故障诊断准确率高达99.62%,具备良好的实际应用价值。 展开更多
关键词 可解释性故障诊断方法 多域特征 XGBoost集成算法 Tree shap 特征解释
在线阅读 下载PDF
基于SHAP-GA-XGBoost融合模型的北京公路货运量预测研究
16
作者 安海岗 孙晓蕾 《物流科技》 2025年第22期93-99,共7页
在北京市公路货运系统日益复杂且对城市经济与物流运转至关重要的背景下,精准预测北京市公路货运量,可为政府交通规划、能源结构调整及应急响应提供科学依据。因此,文章构建SHAP-GA-XGBoost融合模型以更精准的预测北京市公路货运量。首... 在北京市公路货运系统日益复杂且对城市经济与物流运转至关重要的背景下,精准预测北京市公路货运量,可为政府交通规划、能源结构调整及应急响应提供科学依据。因此,文章构建SHAP-GA-XGBoost融合模型以更精准的预测北京市公路货运量。首先,基于需求驱动、供给能力等五大维度,筛选出24个影响北京市公路货运量的初始指标,并使用混频数据模型与KNN反距离权重插值完成数据预处理;其次,利用SHAP值与沃德法筛选出15个关键特征变量,降低模型输入维度;最后,引入Halton低差异序列优化遗传算法初始种群分布,并利用遗传算法实现XGBoost模型的超参寻优。实证结果表明,SHAP-GA-XGBoost融合模型在E_(MAE)、E_(MAPE)等指标上显著优于BP、SVM、LSTM、LSSVM等对比模型,验证了特征工程与算法优化协同的有效性。 展开更多
关键词 shap方法 遗传算法 极限梯度提升模型 公路货运量
在线阅读 下载PDF
基于贝叶斯优化XGBoost-SHAP模型的湖南省麻阳县滑坡易发性评价及其可解释性分析
17
作者 罗鹏 凌跃新 陈迪 《华南地质》 2025年第3期644-656,共13页
在滑坡易发性评价工作中,机器学习模型(如随机森林、梯度提升树、神经网络等)因其可以融合多源数据并处理复杂非线性关系而得到了广泛的应用,但模型决策过程的不透明仍是机器学习模型在滑坡易发性评价中应用仍面临的重要挑战。目前,在... 在滑坡易发性评价工作中,机器学习模型(如随机森林、梯度提升树、神经网络等)因其可以融合多源数据并处理复杂非线性关系而得到了广泛的应用,但模型决策过程的不透明仍是机器学习模型在滑坡易发性评价中应用仍面临的重要挑战。目前,在机器学习模型构建过程中集成可解释分析是揭示模型决策机制从而提高模型透明度的研究方向之一。本文以湖南省麻阳县为研究区,通过XGBoost机器学习算法结合贝叶斯优化算法构建滑坡易发性评价模型,利用混淆矩阵及接受者操作特征曲线开展评价精度验证,以自然断点法对模型的滑坡发生概率进行划分得到滑坡易发性区划图,再结合SHAP(Shapley Additive exPlanations)揭示各影响因子对滑坡发生概率的影响程度,增强模型可信度与可解释性。结果表明,优化后XGBoost模型AUC值(0.8101)相较于初始的XGBoost模型AUC值(0.7974)有一定程度的提升,但优化效果较有限;滑坡极高-高易发区主要集中在研究区的中部和东部,特别是锦江两岸白垩系分布的低丘地区;SHAP特征摘要图揭示了不同特征值对滑坡发育有明显差异,高程、距道路距离和距河流距离是研究区滑坡发育的主要影响因子,对滑坡发育贡献显著。 展开更多
关键词 XGBoost模型 机器学习 shap 易发性评价 麻阳县
在线阅读 下载PDF
基于多模型SHAP融合的5G基站能耗预测研究
18
作者 李林禹 王洁丽 +2 位作者 孟德香 刘智勇 王沁 《电信工程技术与标准化》 2025年第S1期282-287,共6页
随着高效网络管理与能耗监测需求的不断增长,5G无线网络中基于业务特征与能耗指标之间关系的预测建模研究日益受到关注。本文聚焦于分析小区的业务特征与其能耗之间的关联性,采用先进的机器学习算法XGBoost、LightGBM和CatBoost构建多... 随着高效网络管理与能耗监测需求的不断增长,5G无线网络中基于业务特征与能耗指标之间关系的预测建模研究日益受到关注。本文聚焦于分析小区的业务特征与其能耗之间的关联性,采用先进的机器学习算法XGBoost、LightGBM和CatBoost构建多个预测模型以挖掘这种关联。本文的核心创新点在于引人了基于多模型的SHAP值融合方法,实现了对特征重要性更稳健且一致的解释。通过融合不同模型的SHAP输出,有效减少了单一模型带来的解释偏差,从而获得了更具通用性的业务特征对能耗影响的洞察。研究结果深化了对蜂窝网络中业务行为与能耗关系的理解,并为运营商在网络优化与节能管理方面提供了数据驱动的决策支持。 展开更多
关键词 5G无线网络 集成算法 能耗预测 shap
在线阅读 下载PDF
数据驱动的资源受限项目调度问题求解器推荐研究
19
作者 曾鸣 戴业东 刘万安 《计算机工程与应用》 北大核心 2026年第5期346-363,共18页
资源受限项目调度问题(RCPSP)广泛存在于工程管理等领域,高效求解该问题对项目管理至关重要。然而,RCPSP固有的NP-hard特性,使得现有求解方法的性能表现出强烈的项目实例依赖性,难以找到一种通用的高效算法。为此,提出一种基于数据驱动... 资源受限项目调度问题(RCPSP)广泛存在于工程管理等领域,高效求解该问题对项目管理至关重要。然而,RCPSP固有的NP-hard特性,使得现有求解方法的性能表现出强烈的项目实例依赖性,难以找到一种通用的高效算法。为此,提出一种基于数据驱动的RCPSP求解器推荐框架,实现针对不同项目实例的智能化算法选择,从而克服现有算法选择方案的盲目性,提升求解效率。该框架的构建源于对RCPSP问题特征与算法性能之间复杂关系的洞察,试图利用机器学习方法挖掘这种潜在关系,并将其转化为指导算法选择的知识。构建了包含网络拓扑、资源和时间三个维度特征集的RCPSP求解算法推荐数据集;结合特征选择方法提取最优特征子集,构建基于树集成算法的推荐模型,以学习这种复杂映射关系的内在规律,实现精准的算法推荐;利用SHAP模型对推荐模型进行归因分析,剖析影响算法选择的关键项目特征,为项目管理人员提供更具解释性的决策支持。实验结果表明,所提出的推荐框架在四个数据集上的推荐准确率均超过70%,且在各项指标上均优于其他推荐算法。资源强度、项目工期下界和网络宽度等特征被证实对算法选择具有重要影响,该研究验证了数据驱动方法在破解RCPSP算法选择难题方面的可行性和有效性,为项目管理人员提供了科学化、智能化的算法选择方案,有效降低了决策难度,有助于提升项目管理效率。 展开更多
关键词 资源受限项目调度 求解器推荐 数据驱动 树集成算法 shap模型
在线阅读 下载PDF
机器学习模型预测全髋关节置换术后病人谵妄风险的效能研究
20
作者 张小英 刘伟 +2 位作者 谢美英 周建国 杨佳 《护理研究》 北大核心 2026年第6期894-905,共12页
图、依赖图和力图解释和可视化机器学习模型。结果:622例全髋关节置换术病人的术后谵妄发生率为30.87%。Boruta算法筛选出9个术后谵妄风险重要特征变量,根据特征重要性评分(Z值)由高至低依次为C反应蛋白(CRP)、麻醉持续时间、白蛋白(ALB... 图、依赖图和力图解释和可视化机器学习模型。结果:622例全髋关节置换术病人的术后谵妄发生率为30.87%。Boruta算法筛选出9个术后谵妄风险重要特征变量,根据特征重要性评分(Z值)由高至低依次为C反应蛋白(CRP)、麻醉持续时间、白蛋白(ALB)、年龄、总胆红素(TB)、空腹血糖(FBG)、术中失血量(IBL)、糖尿病史、脑血管病(CSD)。多因素Logistic回归分析结果显示,年龄、ALB、TB、FBG、CRP、麻醉持续时间是全髋关节置换术后病人谵妄的独立影响因素(均P<0.05)。XGBoost模型在训练集和测试集中均表现优异,对于预测全髋关节置换术后病人谵妄风险具有最优的稳健性与预测效能。基于SHAP对XGBoost模型进行解释和可视化,显示XGBoost模型能以极高准确度预测全髋置换术后病人谵妄风险。结论:年龄、ALB、TB、FBG、CRP、麻醉持续时间是全髋关节置换术后病人谵妄的重要影响因素,XGBoost模型在全髋关节置换术后病人谵妄中的预测价值较高。 展开更多
关键词 全髋关节置换术 术后谵妄 影响因素 机器学习 Boruta算法 shapley加法解释(shap) XGBoost模型
暂未订购
上一页 1 2 5 下一页 到第
使用帮助 返回顶部