期刊文献+
共找到878篇文章
< 1 2 44 >
每页显示 20 50 100
融合GWRF和SHAP的长三角城市群数字经济与碳排放时空耦合特征及影响因素研究
1
作者 张嵌玮 席广亮 《热带地理》 北大核心 2026年第1期110-128,共19页
文章运用地理加权随机森林(GWRF)与机器学习模型输出解释方法(SHAP),解析2011—2023年长三角地区城市数字经济与碳排放的时空耦合特征及影响因素。研究发现:1)城市群耦合协调度由0.411升至0.505,形成上海单核引领、苏浙跟进、安徽快增... 文章运用地理加权随机森林(GWRF)与机器学习模型输出解释方法(SHAP),解析2011—2023年长三角地区城市数字经济与碳排放的时空耦合特征及影响因素。研究发现:1)城市群耦合协调度由0.411升至0.505,形成上海单核引领、苏浙跟进、安徽快增但临界失调的多级联动格局。2)城市层面耦合协调度呈现“中枢—走廊—边缘”的梯度扩散模式,与长三角一体化战略及基础设施互联的区域发展方向高度契合。3)结合SHAP结果发现,数字要素对数字经济与碳排放之间的耦合协调具有正向效应,且自核心城市向制造节点与新兴产业区扩散;与之相反,碳排放要素则抑制二者协同。研究表明,数字经济与人力资本集聚在产业升级和碳减排中具有核心驱动作用,为长三角优化资源配置、制定差异化低碳政策提供了科学依据,助力区域在数字经济与绿色竞争中实现高质量发展。 展开更多
关键词 地理加权随机森林(GWRF) shap 数字经济 碳排放 耦合协调 长三角城市群
在线阅读 下载PDF
基于RFE-SHAP的具有可解释性纱线质量预测研究
2
作者 张保威 郭智林 王永华 《棉纺织技术》 2026年第1期2-9,共8页
为优化纱线质量预测的特征选择过程,进一步消除小样本环境下存在的冗余特征,提高后续预测过程的准确性、可靠性,提出了一种基于结合递归特征消除算法(RFE)和SHAP的具有可解释性的纱线质量预测方法,即RFE⁃SHAP。首先,选择RFE作为迭代特... 为优化纱线质量预测的特征选择过程,进一步消除小样本环境下存在的冗余特征,提高后续预测过程的准确性、可靠性,提出了一种基于结合递归特征消除算法(RFE)和SHAP的具有可解释性的纱线质量预测方法,即RFE⁃SHAP。首先,选择RFE作为迭代特征选择方法,将支持向量回归(SVR)作为其评估器;然后,引入SHAP技术去量化原始特征对纱线强力及毛羽H值两种纱线质量指标的边际贡献值,从而辅助特征选择,进而提供更直观且解释性更强的特征选择策略;最后,结合神经网络构建纱线强力以及毛羽H值的预测模型。试验结果证明:经RFE⁃SHAP算法得到的最优特征子集作为纱线强力及毛羽H值预测模型的输入时,模型多个评价指标的效果均有提升,其中,对两种纱线质量指标预测的平均绝对百分比误差均未超过3%。认为:该方法具有较高的可行性,可以在一定程度上提高模型的预测性能。 展开更多
关键词 纱线质量预测 特征选择 递归特征消除算法 支持向量回归 shap技术
在线阅读 下载PDF
基于机器学习和SHAP算法的我国粮食安全水平测度重构及可解释性分析 被引量:5
3
作者 王火根 胡梦婷 刘小春 《中国农业大学学报》 北大核心 2025年第7期264-274,共11页
为探讨“大食物观”对中国粮食安全赋予的新内涵,基于2010—2022年中国省级层面数据,从生产安全、质量安全、经济安全、消费安全和流通安全5个维度构建中国粮食安全评价指标体系,在熵值法测算基础上,利用机器学习和SHAP算法重新识别不... 为探讨“大食物观”对中国粮食安全赋予的新内涵,基于2010—2022年中国省级层面数据,从生产安全、质量安全、经济安全、消费安全和流通安全5个维度构建中国粮食安全评价指标体系,在熵值法测算基础上,利用机器学习和SHAP算法重新识别不同影响变量对粮食安全的重要性。结果表明:1)从整体演进趋势来看,2010—2022年中国粮食安全水平总体呈先下降后上升的态势,于2012—2015年和2018—2019年增长迅速;2)从各维度评价得分来看,生产安全对粮食安全贡献度最高,经济安全和质量安全呈上升趋势,消费安全和流通安全是粮食安全体系中的薄弱环节;3)从粮食安全的关联因素来看,影响中国粮食安全水平的关键因素包括肉类总产量、粮食总产量、水产品总产量、铁路货运量、财政涉农支出、森林覆盖率和城乡收入差距。基于此,从推动畜牧业可持续发展,提高粮食生产效率,加强水产养殖发展,加大财政涉农支出等4个方面提出政策建议。 展开更多
关键词 大食物观 XGBoost shap 粮食安全 食物安全
原文传递
融合XGBoost-SHAP的重庆市乡村生态旅游资源竞争力测度研究 被引量:4
4
作者 张慧玲 张虹 孙德亮 《长江流域资源与环境》 北大核心 2025年第3期585-599,共15页
乡村生态旅游资源竞争力是判别旅游发展潜力的重要依据,对乡村产业振兴有重要意义。XGBoost-SHAP解释性机器学习为乡村生态旅游资源竞争力测度提供可视化的智能工具。融合XGBoost-SHAP构建可解释的机器学习模型,以乡村生态旅游资源点为... 乡村生态旅游资源竞争力是判别旅游发展潜力的重要依据,对乡村产业振兴有重要意义。XGBoost-SHAP解释性机器学习为乡村生态旅游资源竞争力测度提供可视化的智能工具。融合XGBoost-SHAP构建可解释的机器学习模型,以乡村生态旅游资源点为样本,从自然人文环境、生态资源和旅游基础设施3个维度选择测度指标,以识别重庆市乡村生态旅游资源竞争力水平。结果表明:(1)XGBoost通过学习样本数据潜在模式或规律,高效的识别了乡村生态旅游地的不同竞争力水平,并实现了较高的精度。(2)SHAP提高了XGBoost模型预测的透明度,能识别乡村生态旅游资源竞争力的主导因子,经济活动强度、NDVI、高程和生境质量是对重庆市乡村生态旅游资源竞争力最重要的4个因子,同时也是乡村生态旅游资源开发与可持续利用的主要考量因素。(3)重庆市乡村生态旅游资源强竞争力区域集中在市场、知名景区和交通沿线附近,形成了重庆市西部市场依托、东南和东北部为交通依托和景区依托3种乡村生态旅游发展模式。(4)资源竞争力具有空间溢出效应,距离核心景区远近是影响其强弱的主要因素,旅游基础设施和市场等人文条件也对其产生重要影响。最后,基于研究结论,对平衡重庆市旅游资源的开发与利用,优化旅游空间布局,以及推动“和美乡村”建设方面提供建议。可解释性机器学习模型能快速、准确测度区域乡村生态旅游资源竞争力,可以为旅游资源识别和定量分析提供方法借鉴。 展开更多
关键词 生态旅游资源 乡村 竞争力 XGBoost-shap 重庆市
原文传递
基于XGBoost⁃SHAP方法的建设项目碳排放空间异质性分析 被引量:2
5
作者 王元庆 李佳玥 +1 位作者 刘备 王芳 《环境科学》 北大核心 2025年第7期4090-4100,共11页
为使公路建设碳减排更有效,聚焦高速公路建设过程中的碳排放空间异质性,基于广东省A高速公路项目40个分段样本筛选出的构造物类型、桥隧比、设计坡度、路线长度、填方量、挖方量和水泥消耗量这7个碳排放影响关键指标,训练与验证了XGBoos... 为使公路建设碳减排更有效,聚焦高速公路建设过程中的碳排放空间异质性,基于广东省A高速公路项目40个分段样本筛选出的构造物类型、桥隧比、设计坡度、路线长度、填方量、挖方量和水泥消耗量这7个碳排放影响关键指标,训练与验证了XGBoost碳排放预测模型,构建了解释这40个路段碳排放空间异质性的SHAP算法,研究了路段特征对碳排放的影响、总特征贡献和特征交互效应.结果表明,水泥消耗量的增加对碳排放的非线性增长贡献最大,路线长度、挖方量和桥隧比对碳排放的贡献度也较为显著;冷热点分析发现坡度高于2.5%且地形复杂的路段碳排放趋高,存在聚集效应;XGBoost-SHAP模型较地理加权回归模型GWR能更清晰解释碳排放的空间分布特征及其影响因素,在捕捉关键碳源和理解碳排放空间分布特征方面表现更佳.基于以上发现,提出了公路建养碳减排的针对性综合策略,以推动公路建设的可持续发展. 展开更多
关键词 碳排放 空间异质性 XGBoost算法 shap算法 可解释性
原文传递
基于LightGBM和SHAP算法的致密油储层孔隙度预测 被引量:2
6
作者 王伟 党海龙 +3 位作者 康胜松 肖前华 丁磊 石立华 《油气地质与采收率》 北大核心 2025年第5期90-99,共10页
为了准确高效地表征致密油储层孔隙度的空间分布特征,同时对机器学习模型的可解释性进行评价,采用Z-Score方法对特征属性进行归一化处理,并应用Optuna超参数优化框架对模型的超参数进行调优,建立了一种基于LightGBM算法的孔隙度预测模型... 为了准确高效地表征致密油储层孔隙度的空间分布特征,同时对机器学习模型的可解释性进行评价,采用Z-Score方法对特征属性进行归一化处理,并应用Optuna超参数优化框架对模型的超参数进行调优,建立了一种基于LightGBM算法的孔隙度预测模型,与GBDT和XGBoost算法模型进行了预测效果的综合对比,并利用SHAP算法对LightGBM模型的输出结果进行了可视化解释分析。研究结果表明:LightGBM模型在训练数据集和测试数据集上的预测决定系数分别为0.984和0.855,模型预测准确度高、泛化能力强,综合预测效果好于GBDT和XGBoost模型。应用SHAP算法对LightGBM模型结果的可解释性进行分析,结果表明,影响LightGBM孔隙度预测模型最重要的5项测井参数为密度、阵列感应电阻率、自然伽马、声波时差和光电吸收截面指数。在研究区某单井X致密层段孔隙度的预测实例中,LightGBM模型预测准确度达93.9%,分别高于GBDT和XGBoost模型的预测准确度86.53%和89.08%;训练时长为0.016 s,分别为GBDT和XGBoost模型训练时长的0.096倍和0.025倍;预测时长为0.01 s,分别为GBDT和XGBoost模型预测时长的0.42倍和0.19倍;LightGBM模型的预测效率相对GBDT和XGBoost模型具有明显优势,其在取心井段上对孔隙度的预测误差更小,预测能力更强,且能更好地拟合低值孔隙度。该方法的应用不仅解决了单井致密层段获取完整准确孔隙度分布的难题,而且提高了孔隙度预测的精度和效率,对致密油储层的评价及高效勘探开发具有一定的参考价值。 展开更多
关键词 致密油储层 机器学习 LightGBM算法 shap算法 孔隙度预测
在线阅读 下载PDF
基于特征工程优化和SHAP解释方法预测圆钢管约束混凝土短柱轴压承载力 被引量:1
7
作者 韦建刚 吴洵桢 +1 位作者 郑裔 杨艳 《东南大学学报(自然科学版)》 北大核心 2025年第5期1328-1336,共9页
以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构... 以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构中常见的9个特征的相关性以及冗余性,从13个机器学习模型中筛选出梯度提升树(GBDT)、随机森林(Random Forest)、极端梯度提升(XGBoost)和极端随机树(Extra Trees)四个最优模型对STCC的极限轴压承载力N_(u)进行预测,并采用SHAP可解释方法对4种模型进行可视化对比分析。研究表明:截面含钢率α在统计分析中方差趋于零且与径厚比B/t呈完全负相关关系;约束效应系数ζ在F检验中与N_(u)的显著性水平小于5%,斯皮尔曼、皮尔森以及互信息量相关性分析均表明其与N_(u)弱相关。通过SHAP方法对上述4种模型可视化发现,XGBoost在测试集上的表现尤为突出,其决定系数R^(2)(0.9626)、均方根误差(287.40 kN)、平均绝对误差(139.13 kN)以及平均绝对百分比误差(5.1%)均为4个模型中的最低值。此外,XGBoost在泛化能力和避免过拟合方面也表现出色,因此更适用于STCC短柱轴压承载力预测。 展开更多
关键词 机器学习 特征工程 shap解释方法 圆钢管约束混凝土 轴压承载力 特征重要性分析
在线阅读 下载PDF
大运河文化带新质生产力的时空分异特征与影响因素——基于机器学习XGBoost-SHAP模型 被引量:3
8
作者 周丙锋 史静 +2 位作者 谢新水 刘晟 曹倩倩 《地域研究与开发》 北大核心 2025年第1期14-22,共9页
采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现... 采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现波动增长态势,相比于绿色生产力、科技生产力,数字生产力占新质生产力比例更大。各地区新质生产力发展水平存在一定差异,北京、江苏、浙江部分地级市为新质生产力发展高峰,河南、安徽为新质生产力发展低谷,且2020年各地新质生产力水平均有所提升。其聚集效应沿大运河呈现“三角”分布现象,且表现出“两角聚集夹分异”的发展趋势。每百人移动电话用户数、全要素劳动生产率等为影响大运河文化带新质生产力水平的主导因素,且各个主导因素之间存在交互效应。 展开更多
关键词 新质生产力 大运河文化带 时空分异 XGBoost-shap模型
在线阅读 下载PDF
基于CatBoost-SHAP-MCM模型的关中地区PM_(2.5)浓度的气象影响因素研究 被引量:1
9
作者 苏佳 聂达文 +3 位作者 李晓萌 张新生 宋金昭 董明放 《环境科学研究》 北大核心 2025年第4期787-797,共11页
为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同... 为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同时利用CatBoost-SHAP-MCM模型识别PM_(2.5)浓度的关键气象影响因素。结果表明:①关中地区PM_(2.5)浓度呈明显的空间分布和季节变异性。年际PM_(2.5)浓度在2021年最低,为42.93μg/m^(3),在2022年最高,达49.09μg/m^(3)。季度和月际变化较为相似,均呈冬季高、夏季低的特征,冬季污染最严重,PM_(2.5)浓度达84.35μg/m^(3),夏季最轻,为21.42μg/m^(3)。西安市、咸阳市和渭南市为高污染城市,铜川市和宝鸡市为低污染城市。②PM_(2.5)浓度与PM10浓度的相关性最高,与CO浓度、SO2浓度相关性均较低。③露点温度、气温、海平面气压、降水量和地面气压为关键气象影响因素,其在各城市表现出显著的影响作用,对关中地区整体和各城市的影响基本保持一致。④在低露点温度、低气温以及低露点温度、高海平面气压和高地面气压等特定因素组合下,其对PM_(2.5)浓度的影响更为显著。研究显示,关中地区PM_(2.5)浓度具有明显的空间分异特征和季节性变化特征,且与露点温度、气温、海平面气压、降水量和地面气压等气象因素密切相关,在特定气象组合条件下PM_(2.5)浓度波动更为显著。 展开更多
关键词 关中地区 PM_(2.5) 影响因素 CatBoost-shap-MCM模型
在线阅读 下载PDF
基于XGBoost-SHAP可解释机器学习模型的城市形态与地表温度的关系 被引量:10
10
作者 谭洁 危千骏 +3 位作者 廖朝阳 邝文俊 邓慧婷 余德 《应用生态学报》 北大核心 2025年第3期659-670,共12页
随着全球大城市中高层建筑的增多,探讨城市二维(2D)和三维(3D)形态对地表温度(LST)的影响,已成为缓解城市热环境和优化城市规划的关键。本研究以长沙市三环以内地区为例,基于2020年多源遥感数据提取了13项城市2D/3D特征因子,通过Pearso... 随着全球大城市中高层建筑的增多,探讨城市二维(2D)和三维(3D)形态对地表温度(LST)的影响,已成为缓解城市热环境和优化城市规划的关键。本研究以长沙市三环以内地区为例,基于2020年多源遥感数据提取了13项城市2D/3D特征因子,通过Pearson相关性分析探讨LST与各特征因子的线性关系,并引入XGBoost模型和SHAP方法揭示其非线性影响和贡献。结果表明:2020年,高温区域主要分布在长沙市中心的建筑密集区,低温区域主要分布在长沙市西部和东北部的森林公园以及湘江沿岸。归一化建筑指数(NDBI)、夜间灯光(NTL)和建设用地比例(PCL)与LST呈显著正相关关系,相关系数分别为0.592、0.537和0.446,表明城市化进程加剧了地表升温;归一化植被指数(NDVI)、天空视角系数(SVF)与LST呈显著负相关关系,相关系数分别为-0.316和-0.200,体现了绿地和开阔空间对缓解城市热岛的重要作用。NDBI、NTL、NDVI和高程(DEM)对LST的影响最大,总贡献度达60.9%;这些2D/3D形态特征因子对LST的影响呈现复杂的非线性特征,其中,NDBI在0~0.2时,对LST提升最显著;NTL超过40后的增温效应趋于饱和;NDVI超过0.5时,降温效果显著增强;DEM在50~150 m对LST的降温效果最突出。本研究验证了XGBoost-SHAP模型揭示城市2D/3D特征因子对LST的非线性影响机制的有效性,并可为城市热环境治理与缓解,以及绿色、低碳、宜居的新型城镇化建设提供科学依据。 展开更多
关键词 城市2D/3D形态 热岛效应 可解释机器学习 XGBoost-shap模型
原文传递
中国西部地区心脏手术患者术后不良预后的预测模型研究:结合机器学习与SHAP解释
11
作者 李帆 胡振飞 +2 位作者 詹海婷 黄一丹 戴晓雯 《中国胸心血管外科临床杂志》 北大核心 2025年第10期1393-1403,共11页
目的构建并比较5种机器学习模型对心脏手术患者术后不良预后的预测效果,通过SHAP(SHapley Additive exPlanations)可解释性分析识别关键决策因素。方法回顾性收集新疆医科大学第一附属医院2023年成人心脏手术患者的围术期数据(包括人口... 目的构建并比较5种机器学习模型对心脏手术患者术后不良预后的预测效果,通过SHAP(SHapley Additive exPlanations)可解释性分析识别关键决策因素。方法回顾性收集新疆医科大学第一附属医院2023年成人心脏手术患者的围术期数据(包括人口学信息、术前指标、术中指标和术后指标)88项,定义患者在心脏手术术后住院期间发生急性肾损伤和/或院内死亡为术后不良预后。根据患者是否发生术后不良预后分为不良预后组和良好预后组。使用最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)回归方法筛选出特征变量后,构建5种机器学习模型:极限梯度提升(eXtreme gradient boosting,XGBoost)、随机森林(random forest,RF)、梯度提升机(gradient boosting machine,GBM)、轻量梯度提升机(light gradient boosting machine,LightGBM)及广义线性模型(generalized linear model,GLM)。数据集按照7∶3的比例,通过分层抽样(以术后预后情况为分层因素)随机分为训练集和测试集。通过受试者工作特征曲线、决策曲线分析及F1 Score等评估模型性能,应用SHAP方法进行特征贡献度解析。结果共纳入患者639例,其中男395例、女244例,中位年龄为62(55,69)岁。不良预后组191例、良好预后组448例,术后不良预后发生率为29.9%。单因素分析中两组各变量差异无统计学意义(P>0.05)。使用LASSO回归筛选出16个特征变量(体外循环辅助时间、术后第3天血糖、肌酸激酶同工酶-MB、全身炎症反应指数等),构建了5种机器学习模型(GLM、RF、GBM、LightGBM、XGBoost)。评估结果显示:XGBoost模型在训练集(n=447)和测试集(n=192)上均表现出最优的预测效能,曲线下面积分别为0.761[95%CI(0.719,0.800)]、0.759[95%CI(0.692,0.818)],并在测试集中阳性预测值和平衡准确度上均优于其他模型。决策曲线分析进一步验证其在多种风险阈值下的临床实用性。SHAP分析提示,体外循环辅助时间、术后第3天血糖、肌酸激酶同工酶-MB及炎症指标(全身炎症反应指数、中性粒细胞与淋巴细胞比值、C反应蛋白与白蛋白比值)等变量对预测贡献度较高。结论XGBoost模型可有效预测心脏术后不良预后,临床应重点关注体外循环辅助时间、控制术后血糖及监测炎症水平来改善患者预后。 展开更多
关键词 极限梯度提升 机器学习 术后风险预测 shap分析 心脏手术
原文传递
基于CatBoost和SHAP的高级别自动驾驶车辆非预期停车冲突风险预测
12
作者 刘擎超 王瑞海 +2 位作者 蔡英凤 王海 陈龙 《汽车安全与节能学报》 北大核心 2025年第1期170-180,共11页
针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,... 针对高级别自动驾驶车辆非预期停车引发的交通冲突及其环境影响问题,现有研究缺乏对风险特征交互的捕获和可解释性评估。本研究提出了一种基于CatBoost和SHAP的风险预测及解释模型,通过分析城市中心、住宅区和郊区交通网络的接管次数,构建了冲突风险预测模型。结果表明,接管次数在城市中心、住宅区和郊区分别为161次、227次和164次,最高单路段接管次数分别为11次、11次和16次;模型预测精度达93%以上。SHAP分析显示,前后车辆间相对速度和相对位置对冲突风险的影响显著。研究结果对提升自动驾驶车辆的可靠性和安全性具有重要意义。 展开更多
关键词 冲突风险 交通排放 高级别自动驾驶 CatBoost算法 shap解释模型
在线阅读 下载PDF
采用SHAP的高压涡轮级高维设计空间数据挖掘
13
作者 杨昭 郭振东 +2 位作者 苏鹏飞 汪祺能 宋立明 《西安交通大学学报》 北大核心 2025年第6期144-154,共11页
为厘清涡轮级高维设计空间中各变量对级性能的影响,基于数据挖掘方法SHAP对GE-E3高压涡轮第一级的93个设计变量进行了知识挖掘。除常规数据挖掘工作中显著变量对总体性能的影响分析外,发展了显著变量对涡轮级沿叶高方向性能分布影响的... 为厘清涡轮级高维设计空间中各变量对级性能的影响,基于数据挖掘方法SHAP对GE-E3高压涡轮第一级的93个设计变量进行了知识挖掘。除常规数据挖掘工作中显著变量对总体性能的影响分析外,发展了显著变量对涡轮级沿叶高方向性能分布影响的分析方法,可视化表示了改善级总体性能的设计变量所影响的涡轮级的具体位置;同时,充分发挥SHAP局部解释的优势,在设计空间中选取典型样本进行归因分析,研究了各设计变量在样本性能指标变化中所发挥的作用。研究发现,对于高压涡轮级,影响级效率的显著变量包括有效出气角、静叶三维积叠参数、叶片吸力面前缘附近样条控制点等。基于GE-E3高压涡轮数据集进行数据挖掘归纳得到涡轮级设计准则:减小动叶中间截面有效出气角、增大静叶中间截面有效出气角,静叶三维积叠点周向顶部位置、周向中间位置向压力面偏移,静叶中间截面、动叶中间截面吸力面前缘附近控制点均向叶片变薄方向移动。遵循设计准则得到的最终设计使级效率提高了0.65%。 展开更多
关键词 高压涡轮级 高维设计空间 数据挖掘 shap方法
在线阅读 下载PDF
基于分层时空框架的共享单车需求预测:LP-TFT模型与SHAP可解释分析
14
作者 李聪颖 袁锴璐 +3 位作者 李静怡 郑晓晶 李坤 何源 《中国公路学报》 北大核心 2025年第10期305-323,共19页
为揭示共享单车系统需求演变规律,并明确不同因素对需求的影响,提出一种融合特征解耦与深度学习的集群-站点级分层时空预测框架。首先,基于站点间的关联性与相似性改进LP算法,构建站点集群划分模型,其中关联性通过空间距离与出行流量表... 为揭示共享单车系统需求演变规律,并明确不同因素对需求的影响,提出一种融合特征解耦与深度学习的集群-站点级分层时空预测框架。首先,基于站点间的关联性与相似性改进LP算法,构建站点集群划分模型,其中关联性通过空间距离与出行流量表征,相似性通过POI相似度与历史出行量相似度加权表征;引入借还不平衡差异指数评价聚类效果,以最小化借还不平衡差异指数为目标进行站点集群划分;在此基础上,分别建立基于TFT模型的集群级与站点级需求预测模型,并将集群级预测结果整合进站点级预测过程中;最后,运用SHAP方法解析不同因素对集群级与站点级共享单车需求的影响机制。研究结果表明:集群级需求预测过程中,小时特征对集群级需求的影响最显著,表现为夜间抑制、日间促进,气象因素呈现双向调节作用,在温度适中、气压较高、风速与湿度较低时对需求产生促进作用;站点级需求预测过程中,集群需求为核心影响因素,随着集群级结果的引入,站点级预测结果的决定系数R^(2)由0.7679提升至0.8504,平均绝对误差MAE由1.2152降至0.9755,误差降低约19.73%;气象因素在站点层级展现出一定的独立影响趋势,如在部分低温、高湿或风速较大的情境下仍可能促进需求,表明站点级需求不仅依赖于集群需求的整体波动,还受站点周边环境的影响,具有一定独立性。研究构建了基于分层时空框架的共享单车需求预测方法,可为共享单车需求驱动因素识别与动态调度提供决策支持。 展开更多
关键词 交通工程 共享单车需求预测 LP算法 TFT算法 shap可解释分析
原文传递
基于XGBoost-SHAP模型的上海中心城区地面沉降驱动因子识别
15
作者 王建秀 代如凤 +5 位作者 吴建中 龙燕霞 黄鑫磊 严龙 吴炜枫 朱令 《工程地质学报》 北大核心 2025年第6期2291-2301,共11页
上海市地面沉降已步入微量沉降阶段,其驱动因素由单一地下水开采主导转向多因素耦合驱动,对驱动因素的研究可为城市地质灾害精准防控提供科学依据。利用XGBoost机器学习模型模拟预测上海市中心城区的地面沉降,并用SHAP方法阐明各因素对... 上海市地面沉降已步入微量沉降阶段,其驱动因素由单一地下水开采主导转向多因素耦合驱动,对驱动因素的研究可为城市地质灾害精准防控提供科学依据。利用XGBoost机器学习模型模拟预测上海市中心城区的地面沉降,并用SHAP方法阐明各因素对地面沉降的影响。基于2020~2024年上海市中心城区地面沉降量、水位变幅、地温变化、地层岩性以及工程建设4类驱动因素共12个因子数据训练、验证XGBoost模型,并结合SHAP方法对模型结果进行解释。结果表明:基于XGBoost算法构建的模型能够较好地拟合和预测地面沉降量(R^(2)=0.9846,RMSE=0.1240,MAE=0.0900);在所研究的因素中,XGBoost+SHAP方法揭示了上海市中心城区地面沉降的驱动因素主要为浅部含水层水位变幅、恒温层温度场变化、软土层厚度以及地层岩性等关键变量,其中浅部含水层水位变幅、恒温层温度对沉降具有正向影响,软土层厚度、地层砂性土比例表现为负向影响。利用机器学习结合SHAP的方法研究地面沉降驱动因素,兼具理论价值与现实指导意义。 展开更多
关键词 地面沉降 XGBoost shap 驱动因素 机器学习
在线阅读 下载PDF
基于微震及SHAP机器学习的高位崩塌落石分类识别
16
作者 杨宗佶 黄志勇 +1 位作者 庞博 武钊颖 《人民长江》 北大核心 2025年第9期10-19,82,共11页
高位崩塌落石灾害具有速度快、能量大和监测难度高的特点,对传统的接触式监测预警带来极大挑战。为此,引入机器学习及SHAP方法,结合微震现场监测,建立了分类判识模型,量化了各特征指标对模型决策的贡献度,从而提升了模型的分类准确性和... 高位崩塌落石灾害具有速度快、能量大和监测难度高的特点,对传统的接触式监测预警带来极大挑战。为此,引入机器学习及SHAP方法,结合微震现场监测,建立了分类判识模型,量化了各特征指标对模型决策的贡献度,从而提升了模型的分类准确性和特征可解释性。通过STA/LTA算法和人工选择,构建了震裂山体的崩塌落石事件目录。基于16968个微震事件,结合时域、频域和时频域等60个地震特征指标和Autoencoder提取的16个潜在特征指标,作为机器学习分类判识模型的输入指标,通过随机搜索算法优化模型,最终实现了99%的分类识别准确率;根据SHAP值排序选取前9个最具贡献的指标,发现地震特征指标中波形增大衰减比、DFT平均比率等9个指标在两个模型中均是主要贡献特征,并基于此构建了简化后的分类指标体系。结果表明:简化模型不仅显著节省了计算资源,提高了计算速度,还保持了分类准确率。研究证明了微震监测技术结合可解释机器学习算法不仅能快速、准确地识别落石事件,还能增强模型的可解释性,为高位崩塌落石的早期识别和监测预警提供了新的解决方案。 展开更多
关键词 崩塌落石 微震监测 shap 机器学习 监测预警
在线阅读 下载PDF
一种兼具精度与可解释性的Stacking-SHAP滑坡易发性预测集成方法
17
作者 黄鑫 叶健 +3 位作者 刘骋冰 曾秋雨 郭万新 郭志凯 《测绘学报》 北大核心 2025年第10期1826-1840,共15页
滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性... 滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性预测的准确性与诱因分析的可靠性。本文方法采用Stacking集成框架,融合XGBoost、CatBoost、LightGBM、逻辑回归(LR)、随机森林(RF)等多种机器学习分类器,在保证预测精度的基础上,引入SHAP(shapley additive explanations)算法,以增强模型的可解释性。试验结果表明,Stacking-SHAP模型的AUC值达到0.920,显著优于单一分类器模型,如XGBoost(0.893)、CatBoost(0.894)、LightGBM(0.879)、RF(0.859)和LR(0.794)。更重要的是,相较于SHAP集成单一机器学习模型,Stacking-SHAP可解释增强集成模型在滑坡诱因分析方面表现出更优的综合性能,提高了滑坡致灾因素分析的可信度。整体而言,本文方法兼具高精度预测与高可靠性解释,为滑坡易发性预测与诱因分析提供了一种创新性方法,在滑坡防治与减灾领域具有重要的理论与应用价值。 展开更多
关键词 滑坡易发性 地理大数据 Stacking算法 shap算法 滑坡诱因分析
在线阅读 下载PDF
北京市轨道交通站点功能演变及驱动因素:基于机器学习XGBoost-SHAP模型
18
作者 周丙锋 曹倩倩 +3 位作者 谢新水 朱珊 史静 钱昊 《科学技术与工程》 北大核心 2025年第26期11346-11357,共12页
轨道交通站点的功能综合反映了城市土地利用状况和城市空间活力。轨道交通站点与城市用地的和谐发展,对于优化城市交通、提升土地使用效率具有显著的正面影响。首先运用信息熵测算站点功能多样性,进一步运用优势度与均匀度探究站点功能... 轨道交通站点的功能综合反映了城市土地利用状况和城市空间活力。轨道交通站点与城市用地的和谐发展,对于优化城市交通、提升土地使用效率具有显著的正面影响。首先运用信息熵测算站点功能多样性,进一步运用优势度与均匀度探究站点功能演变的空间分布特征和结构特征,最后使用XGBoost-SHAP机器学习模型探讨了其驱动因素以及它们之间的交互效应。研究表明:从时间维度上看,2012—2023年间站点功能信息熵总体呈现波动下降趋势。从空间维度上看,二环内变化型站点居多,二环至五环相对稳定,五环至六环站点变化明显,整体站点功能动态不稳定,变化型站点占比高达76%。从结构维度上看,站点功能构成经历了明显的变化,商服型和交通型站点增长,居住型、产业型及公共型站点减少或波动下降。从驱动因素上看,站点范围内的POI(point of interest)数量、路网密度和生产总值等是影响北京地铁站点功能混合度水平的主导因素,且各个主导因素之间存在交互效应。本文研究结果对于改善地铁站点周边土地的使用效率和增强站点的活力具有重要意义。 展开更多
关键词 轨道交通站点 站点功能演变 驱动因素 XGBoost-shap 北京市
在线阅读 下载PDF
基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型
19
作者 盛武 王灵子 《工矿自动化》 北大核心 2025年第6期21-27,140,共8页
针对目前综采工作面上隅角瓦斯浓度预测模型由于“黑盒”结构导致内部运行逻辑未知、预测结果可解释性弱的问题,提出一种基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型。对综采工作面瓦斯涌出浓度关联监测数据进行相关分析,筛选出特... 针对目前综采工作面上隅角瓦斯浓度预测模型由于“黑盒”结构导致内部运行逻辑未知、预测结果可解释性弱的问题,提出一种基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型。对综采工作面瓦斯涌出浓度关联监测数据进行相关分析,筛选出特征变量;基于XGBoost搭建上隅角瓦斯浓度预测模型,引入SHAP算法计算每个特征变量对预测结果的贡献值,增强模型透明度,为XGBoost提供全局性解释;最后利用现场多源传感监测数据对模型性能进行验证。实例分析结果表明:①XGBoost模型的决定系数R^(2)、平均绝对误差(MAE)、均方根误差(RMSE)分别为0.93,0.007,0.008,相较于随机森林(RF)、支持向量回归(SVR)和梯度提升决策树(GBDT),拟合优度最高,误差最低。②XGBoost模型的平均相对误差为4.478%,相较于对比模型,具有较高的精度与较好的泛化性能。③依据各输入特征的平均绝对SHAP值,工作面T1瓦斯浓度对上隅角瓦斯浓度影响最大,工作面上隅角瓦斯抽采管道内瓦斯浓度次之,回采煤层瓦斯含量、回采煤层顶板压力等紧随其后,说明XGBoost能捕捉变量间的非线性关系和交互作用,SHAP算法可为XGBoost模型提供全局性解释。 展开更多
关键词 瓦斯浓度预测 上隅角瓦斯溯源 XGBoost模型 shap 可解释性
在线阅读 下载PDF
基于E5-SHAP算法的可解释英语作文自动评分语言模型
20
作者 王兵 单瑞雪 +1 位作者 邢海燕 李盼池 《智能科学与技术学报》 2025年第3期370-380,共11页
针对英语作文自动评分系统因依赖复杂深度学习模型而缺乏可解释性的问题,提出了一种基于E5-SHAP算法的可解释英语作文自动评分模型。该模型基于E5-Base模型编码器提取文本特征,结合均值计算和回归层实现评分输出,并引入自适应加权机制,... 针对英语作文自动评分系统因依赖复杂深度学习模型而缺乏可解释性的问题,提出了一种基于E5-SHAP算法的可解释英语作文自动评分模型。该模型基于E5-Base模型编码器提取文本特征,结合均值计算和回归层实现评分输出,并引入自适应加权机制,从语法、句法、词汇多样性等6个维度综合评估作文质量。模型采用LoRA微调技术优化特定层参数,提高对作文特征的适应性。通过SHAP算法计算各特征对最终评分的影响,从而提供清晰的评分依据和解释路径,提升评分过程的透明性和可信度。实验结果表明,与现有模型相比,该模型在ELLIPSE数据集和自建数据集上的表现均有所提升,二次加权卡帕值(QWK)达0.84,在准确性和可解释性上优于现有模型。 展开更多
关键词 英语作文 自动评分模型 E5-shap算法 可解释性
原文传递
上一页 1 2 44 下一页 到第
使用帮助 返回顶部