期刊文献+
共找到966篇文章
< 1 2 49 >
每页显示 20 50 100
基于XGBoost+SHAP揭示四川生态脆弱性的驱动力因子及其生态保护评估
1
作者 陈柄桦 李状 +5 位作者 粟丰 张明山 刘瑞 白景昊 张云辉 罗欢 《地质通报》 北大核心 2026年第1期105-120,共16页
【研究目的】通过植被净初生产力单指标结合机器学习方法,克服传统综合指标体系的主观性局限,定量解析驱动机制,为四川省国土空间分区管控、生态保护修复及生态保护评估提供科学依据。【研究方法】基于IPCC生态脆弱性定义,以四川省2001... 【研究目的】通过植被净初生产力单指标结合机器学习方法,克服传统综合指标体系的主观性局限,定量解析驱动机制,为四川省国土空间分区管控、生态保护修复及生态保护评估提供科学依据。【研究方法】基于IPCC生态脆弱性定义,以四川省2001—2023年植被净初级生产力(NPP)为单一评价指标,结合空间自相关、热点分析与XGBoost+SHAP机器学习模型,系统揭示四川省生态脆弱性空间格局及驱动因子影响程度。【研究结果】研究显示:①四川省生态脆弱性整体较高,70%的区域处于中度及以上脆弱水平,空间分布呈西高东低特征,极度脆弱区集中于盆地边缘及横断山脉;②生态脆弱性受自然与人类活动因子交互作用控制,Pearson相关分析显示高程、平均气温、地表温度、降雨等为关键自然驱动因子,而SHAP值定量表明土地利用程度(贡献度最高)、地表温度及平均气温是核心驱动因素;③生态脆弱性空间集聚显著,热点区集中于川西高原及盆地边缘。【结论】生态脆弱性在空间上呈现显著的正相关关系,生态敏感性的空间集聚程度最高,其次为脆弱性,适应性则最低;土地利用程度、地表温度及平均气温是影响生态脆弱性指数变化的主要驱动因子。 展开更多
关键词 生态脆弱性 净初级生产力 Pearson相关分析 XGBoost shap 生态地质调查工程 四川省
在线阅读 下载PDF
青藏高原湖泊表层水温的非线性协同驱动机制:基于深度学习+SHAP融合分析框架
2
作者 石海韵 祁毅 +2 位作者 李婉宁 沈吉 倪天华 《湖泊科学》 北大核心 2026年第2期842-856,I0065,共16页
青藏高原是全球气候变化敏感区,其高海拔湖泊表层水温(LSWT)的演变对区域生态安全具有重要指示意义。在探究影响湖泊水温变化的因素时,相关研究普遍涉及气象条件、地形地貌等多种影响因子。然而,传统方法对多因子非线性交互效应的定量... 青藏高原是全球气候变化敏感区,其高海拔湖泊表层水温(LSWT)的演变对区域生态安全具有重要指示意义。在探究影响湖泊水温变化的因素时,相关研究普遍涉及气象条件、地形地貌等多种影响因子。然而,传统方法对多因子非线性交互效应的定量解析能力有限。本研究以青藏高原106个大中型湖泊为对象,构建基于长短期记忆网络(LSTM)的深度学习模型,结合SHAP(SHapley Additive exPlanation)可解释性方法,分别从整体与个体湖泊尺度上,定量分析了气温、降水、向下长波辐射、向下短波辐射、气压、比湿和风速7项因子对LSWT的影响。具体而言,研究系统解析了各驱动因子的独立作用效应、因子间的交互作用效应,以及这些效应在不同湖泊间的差异性,进而揭示了LSWT变化的驱动机制及其协同作用模式。结果表明:(1)向下长波辐射和向下短波辐射是LSWT的主导驱动因子,在整体与个体尺度的贡献度分别位列前两位(全局SHAP值占比>80%),且与LSWT呈显著正相关;气温、比湿次之,气压、降水和风速影响最小。(2)因子间交互效应普遍存在,识别出4类主导协同驱动模式:线型(如向下长波辐射-气温,67.92%湖泊)、倒U型(如比湿-气温,51.89%湖泊)、效应交叉型(如风速-比湿,70.75%湖泊)及阈值约束型(如降水-气压,100%湖泊)。(3)SHAP方法有效量化了协同驱动的非线性特征,揭示了高原湖泊对辐射因子的高度敏感性,归因于稀薄大气下太阳辐射的高渗透性。本研究创新性地融合深度学习与可解释性分析,为高海拔湖泊水温的复杂驱动机制提供了定量化解析框架,对预测气候变化背景下的水温响应及制定差异化调控策略具有重要科学意义。 展开更多
关键词 湖泊表层水温 深度学习 shap可解释性 协同驱动机制 阈值效应 青藏高原
在线阅读 下载PDF
基于WGAN-GP-Transformer的地表沉陷SHAP可解释预测模型
3
作者 刘超 夏大平 《金属矿山》 北大核心 2026年第2期203-217,共15页
为实现地表沉陷的精准预测,以及对预测结果进行深度解释来指导实际工程,提出了基于改进生成对抗网络(WGAN-GP)与Transformer的地表沉陷SHAP可解释模型。利用该模型对地表下沉量、影响角正切和拐点偏移距进行预测,从而将预测参数结合概... 为实现地表沉陷的精准预测,以及对预测结果进行深度解释来指导实际工程,提出了基于改进生成对抗网络(WGAN-GP)与Transformer的地表沉陷SHAP可解释模型。利用该模型对地表下沉量、影响角正切和拐点偏移距进行预测,从而将预测参数结合概率积分法来建立地表沉陷公式。首先,利用Wasserstein距离、梯度惩罚策略对传统生成对抗网络进行改进,以增强地表沉陷数据,丰富训练集。然后,采用基于多头自注意力机制的Transformer架构对增强数据进行深度学习,并通过贝叶斯优化寻优超参数。最后,基于SHAP法对预测过程与结果进行全面剖析解释,以揭示不同特征对预测参数的影响规律。结果表明:WGAN-GP-Transformer对下沉量、影响角正切与拐点偏移距在测试集上表现出优异的预测能力,表明模型能有效捕捉预测地表沉陷的复杂非线性特征,以及可有效应对数据稀缺的场景。揭示了影响3个预测参数的特征贡献强度与作用方向存在显著差异;松散层厚度对预测下沉量影响最大,采深对预测影响角正切和拐点偏移距的影响最大。模型在鲁西南某矿3301工作面的实际应用表明,其预测沉陷曲线与实际情况高度吻合,验证了其在实际工程中的可靠性与泛化性能。 展开更多
关键词 地表沉陷预测 Transformer WGAN-GP shap 深度学习
在线阅读 下载PDF
基于机器学习的SHAP和PDP分析对UHPC流变性能的研究
4
作者 周祥胥 段锋 朱博 《材料导报》 北大核心 2026年第2期86-93,共8页
本工作使用机器学习方法结合可解释性工具Shapley Additive exPlanations(SHAP)和Partial Dependence Plot(PDP)来准确预测超高性能混凝土(UHPC)的流变性。通过收集大量的UHPC流变参数相关数据,输入包括用水量、矿物掺合料掺量以及外加... 本工作使用机器学习方法结合可解释性工具Shapley Additive exPlanations(SHAP)和Partial Dependence Plot(PDP)来准确预测超高性能混凝土(UHPC)的流变性。通过收集大量的UHPC流变参数相关数据,输入包括用水量、矿物掺合料掺量以及外加剂掺量等在内的变量,构建了四种机器学习预测模型,通过R^(2)、MAE以及RMSE等评估指标选出最佳模型,并进行SHAP以及PDP分析。实验结果表明,最佳机器学习模型结合SHAP和PDP的方法能够有效地预测UHPC的流变性,并且方法的可解释性有助于更好地理解模型的预测过程和结果,为进一步优化UHPC配合比提供了依据。 展开更多
关键词 shap PDP 超高性能混凝土(UHPC) 机器学习 流变性能
在线阅读 下载PDF
融合GWRF和SHAP的长三角城市群数字经济与碳排放时空耦合特征及影响因素研究
5
作者 张嵌玮 席广亮 《热带地理》 北大核心 2026年第1期110-128,共19页
文章运用地理加权随机森林(GWRF)与机器学习模型输出解释方法(SHAP),解析2011—2023年长三角地区城市数字经济与碳排放的时空耦合特征及影响因素。研究发现:1)城市群耦合协调度由0.411升至0.505,形成上海单核引领、苏浙跟进、安徽快增... 文章运用地理加权随机森林(GWRF)与机器学习模型输出解释方法(SHAP),解析2011—2023年长三角地区城市数字经济与碳排放的时空耦合特征及影响因素。研究发现:1)城市群耦合协调度由0.411升至0.505,形成上海单核引领、苏浙跟进、安徽快增但临界失调的多级联动格局。2)城市层面耦合协调度呈现“中枢—走廊—边缘”的梯度扩散模式,与长三角一体化战略及基础设施互联的区域发展方向高度契合。3)结合SHAP结果发现,数字要素对数字经济与碳排放之间的耦合协调具有正向效应,且自核心城市向制造节点与新兴产业区扩散;与之相反,碳排放要素则抑制二者协同。研究表明,数字经济与人力资本集聚在产业升级和碳减排中具有核心驱动作用,为长三角优化资源配置、制定差异化低碳政策提供了科学依据,助力区域在数字经济与绿色竞争中实现高质量发展。 展开更多
关键词 地理加权随机森林(GWRF) shap 数字经济 碳排放 耦合协调 长三角城市群
在线阅读 下载PDF
新型炎症指数对老年重症心力衰竭患者近期死亡风险的预测价值:基于SHAP算法的可解释性分析
6
作者 张婷 陈睿 曹文斋 《中华保健医学杂志》 2026年第1期5-10,共6页
目的 构建可解释性机器学习模型,预测老年重症心力衰竭患者短期死亡风险,并探讨新型炎症指数的预测价值。方法回顾性分析MIMIC-IV 3.1数据库中诊断为心力衰竭的老年重症患者1994例,按7∶3的比例随机分为训练集和测试集。采用6种机器学... 目的 构建可解释性机器学习模型,预测老年重症心力衰竭患者短期死亡风险,并探讨新型炎症指数的预测价值。方法回顾性分析MIMIC-IV 3.1数据库中诊断为心力衰竭的老年重症患者1994例,按7∶3的比例随机分为训练集和测试集。采用6种机器学习方法建立预测模型,包括logistic回归(LR)、决策树(DT)、随机森林(RF)、自适应增强(AdaBoost)、轻量梯度提升(LightGBM)、高斯朴素贝叶斯(NB)。模型效能通过受试者工作特征(ROC)曲线、精确率-召回率(P-R)曲线、校准曲线评估。采用SHAP进行模型解释并筛选核心炎症指数,通过ROC曲线确定最佳临界值。结果本研究共纳入1994例老年重症心力衰竭患者,28 d内死亡253例(12.7%),存活1741例(87.3%)。经初筛,纳入65个临床特征用于机器学习模型构建。结果显示LightGBM模型展现出最佳的预测性能,ROC曲线下面积(AUC)为[0.897(0.881~0.909)],P-R曲线的平均精度(AP)为0.86,校准曲线显示预测概率与实际观察结果一致。SHAP值分析揭示急性生理学评分Ⅲ(APSⅢ)、格拉斯哥昏迷评分(GCS)、单核细胞与淋巴细胞比值(MLR)、呼吸频率(RR)、年龄、血尿素氮、牛津急性疾病严重度评分(OASIS)、血管紧张素转化酶抑制剂(ACEI)、中性粒细胞与淋巴细胞比值(NLR)、营养风险指数(NRI)是重要的影响因素。ROC曲线分析MLR、NLR的AUC分别为0.682、0.667,以0.426、7.083为截断值,敏感度为0.747、0.751,特异度为0.529、0.503。结论LightGBM模型可较好地预测老年重症心力衰竭患者短期死亡风险,以NLR、MLR为代表的新型炎症指数对老年心力衰竭患者短期死亡风险分层具有潜在临床应用价值。 展开更多
关键词 心力衰竭 死亡风险 单核细胞与淋巴细胞比值 中性粒细胞与淋巴细胞比值 shap算法
暂未订购
GA-RF:基于SHAP的不平衡数据中风识别的优化研究
7
作者 胡译丹 高阳 +1 位作者 尹畅 过子宽 《理论数学》 2026年第1期17-28,共12页
在疾病初筛的场景中,数据失衡会导致分类器偏向多数类的预测偏差,对模型的性能产生影响。因此,选择合适的数据不平衡处理策略与分类器,对改进性能具有关键意义。本文分析不平衡的中风数据集,构建多种实验方案:引入11种数据不平衡处理方... 在疾病初筛的场景中,数据失衡会导致分类器偏向多数类的预测偏差,对模型的性能产生影响。因此,选择合适的数据不平衡处理策略与分类器,对改进性能具有关键意义。本文分析不平衡的中风数据集,构建多种实验方案:引入11种数据不平衡处理方法,结合4种机器学习算法对中风患者进行识别(逻辑回归、SVM、CNN、随机森林)。在多组模型的对比中,得到RUS处理后的逻辑回归、SVM与随机森林优于其他方法,并引入PCA降维分析噪声数据。然后,利用PSO、GA、DE、BO对这3个模型进行优化,得到GA-RF的AUC为84.18%,Recall为91.06%,优势显著。最后,为突破解释性局限,采用SHAP对模型的特征重要性进行分析,得到年龄对中风识别的作用远超其余特征。 展开更多
关键词 数据不平衡处理 中风 随机森林 优化算法 shap
在线阅读 下载PDF
基于XGBoost-SHAP算法的夏热冬冷地区住宅建筑碳排放时空演变及影响因素研究
8
作者 么智 《环境工程技术学报》 北大核心 2026年第1期83-99,共17页
为系统探究夏热冬冷地区住宅建筑碳排放的时空演变规律及其驱动机制,利用2007—2021年九省市的面板数据,采用Slope值、泰尔指数及标准差椭圆等方法探究碳排放的时空特征,结合经贝叶斯超参数优化的XGBoost-SHAP框架,分析该地区碳排放的... 为系统探究夏热冬冷地区住宅建筑碳排放的时空演变规律及其驱动机制,利用2007—2021年九省市的面板数据,采用Slope值、泰尔指数及标准差椭圆等方法探究碳排放的时空特征,结合经贝叶斯超参数优化的XGBoost-SHAP框架,分析该地区碳排放的驱动机制差异。结果发现:碳排放总量从2007年的185.64百万t增至2021年的334.61百万t,增速呈现显著的阶段性特征;空间分布呈现出显著的上下游梯度特征及南北向集聚、东西向发散的演化趋势,区域内差异贡献率持续超过90%;影响维度的作用大小为人口规模>技术水平>经济发展>建筑属性>政策支持>气候特征,上、中、下游地区分别呈现“能源主导型”“人口主导型”和“能源经济双轮驱动型”的差异化发展模式,各影响因素普遍存在显著的非线性效应和临界特征。针对区域差异,提出构建“三层联动”的区域协同机制,实施“双轨并进”“精细化管理”和“系统集成”的差异化减排策略。 展开更多
关键词 夏热冬冷地区 住宅建筑 碳排放 时空演变 XGBoost-shap算法
在线阅读 下载PDF
基于XGBoost-Shap的抽油机井系统效率影响因素重要性分析
9
作者 施鸿博 《中外能源》 2026年第1期72-78,共7页
为了明确抽油机井系统效率的影响因素以及各影响因素的重要性,采用XGBoost算法对系统效率进行回归,并利用Shap解释模型进行影响因素确定和分析。日产液对系统效率的影响最为显著(Shap=0.748),而动液面、有功功率的影响大体相当(Shap=0.... 为了明确抽油机井系统效率的影响因素以及各影响因素的重要性,采用XGBoost算法对系统效率进行回归,并利用Shap解释模型进行影响因素确定和分析。日产液对系统效率的影响最为显著(Shap=0.748),而动液面、有功功率的影响大体相当(Shap=0.341、0.346),其余指标的影响较小。日产液、有功功率、动液面对系统效率的影响分别为正向、负向、正向,其中动液面的正向影响有限。低于40t的产量范围是系统效率快速增加的高效区,在这个区间内日产液增加对系统效率的提高效果显著;当日产液>60t以后,由于特征影响的抵消作用,Shap值趋于最高且将趋于稳定。在400m动液面范围内,较均匀地分布了较多的低日产液井,这部分井的动液面、日产液均较低,促使其Shap值处于拉低系统效率的负值状态,可作为潜力井进行措施调整。日产液越高,日产液的Shap值越大,系统效率越高,数据显示出很强的规律性。宏观上有功功率、动液面对系统效率的影响未发现强规律性。 展开更多
关键词 抽油机井 系统效率 日产液 有功功率 动液面 shap
原文传递
基于RFE-SHAP的具有可解释性纱线质量预测研究
10
作者 张保威 郭智林 王永华 《棉纺织技术》 2026年第1期2-9,共8页
为优化纱线质量预测的特征选择过程,进一步消除小样本环境下存在的冗余特征,提高后续预测过程的准确性、可靠性,提出了一种基于结合递归特征消除算法(RFE)和SHAP的具有可解释性的纱线质量预测方法,即RFE⁃SHAP。首先,选择RFE作为迭代特... 为优化纱线质量预测的特征选择过程,进一步消除小样本环境下存在的冗余特征,提高后续预测过程的准确性、可靠性,提出了一种基于结合递归特征消除算法(RFE)和SHAP的具有可解释性的纱线质量预测方法,即RFE⁃SHAP。首先,选择RFE作为迭代特征选择方法,将支持向量回归(SVR)作为其评估器;然后,引入SHAP技术去量化原始特征对纱线强力及毛羽H值两种纱线质量指标的边际贡献值,从而辅助特征选择,进而提供更直观且解释性更强的特征选择策略;最后,结合神经网络构建纱线强力以及毛羽H值的预测模型。试验结果证明:经RFE⁃SHAP算法得到的最优特征子集作为纱线强力及毛羽H值预测模型的输入时,模型多个评价指标的效果均有提升,其中,对两种纱线质量指标预测的平均绝对百分比误差均未超过3%。认为:该方法具有较高的可行性,可以在一定程度上提高模型的预测性能。 展开更多
关键词 纱线质量预测 特征选择 递归特征消除算法 支持向量回归 shap技术
在线阅读 下载PDF
基于D-P屈服准则考虑剪胀性的深部围岩弹塑性解析及其敏感性SHAP分析
11
作者 韩磊 卜玉峰 《有色金属(矿山部分)》 2026年第1期173-183,共11页
针对深部巷道围岩稳定性分析中传统强度准则未考虑中间主应力及剪胀性的问题,基于Drucker-Prager(D-P)屈服准则,建立了考虑剪胀性的围岩弹塑性解析模型。通过引入中间主应力系数(s)量化三向应力状态,结合非关联流动法则定义塑性区与破... 针对深部巷道围岩稳定性分析中传统强度准则未考虑中间主应力及剪胀性的问题,基于Drucker-Prager(D-P)屈服准则,建立了考虑剪胀性的围岩弹塑性解析模型。通过引入中间主应力系数(s)量化三向应力状态,结合非关联流动法则定义塑性区与破裂区扩容系数,推导了弹性区、塑性残余区及破裂区的应力-应变表达式与分区半径解析解。采用SHAP(Shapley Additive exPlanations)值方法,量化分析了中间主应力系数、剪胀角等12个参数对塑性区半径(R_(p))和破裂区半径(Rz)的影响程度及非线性特征。结果表明:中间主应力系数对分区半径的影响呈非线性,在0.4~0.8区间影响稳定;塑性区剪胀角主要促进塑性区扩展并抑制破裂区发展;破裂区剪胀角对破裂区半径的影响受多因素耦合调控。SHAP分析揭示塑性区内摩擦角、原岩应力和开挖半径是影响分区半径的关键参数,其重要性显著高于弹性模量、泊松比等物理参数。研究成果为深部巷道围岩稳定性分析提供了考虑多物理场耦合的理论模型,且SHAP方法为复杂岩土工程参数敏感性分析提供了新途径。 展开更多
关键词 Drucker-Prager屈服准则 中间主应力系数 剪胀性 shap分析 围岩稳定性
在线阅读 下载PDF
基于可解释机器学习与SHAP值的精神分裂症患者攻击行为风险预测研究
12
作者 吴青青 沈藕英 陈琳霞 《医院管理论坛》 2026年第1期65-71,共7页
目的通过可解释的机器学习(ML)技术,提高对精神分裂症患者攻击行为风险的预测准确性。方法选取我院2022年1月—2024年6月间收治的529例精神分裂症患者作为研究对象。通过Boruta筛选患者攻击行为特征,以3∶2比例随机分为317例训练集和21... 目的通过可解释的机器学习(ML)技术,提高对精神分裂症患者攻击行为风险的预测准确性。方法选取我院2022年1月—2024年6月间收治的529例精神分裂症患者作为研究对象。通过Boruta筛选患者攻击行为特征,以3∶2比例随机分为317例训练集和212例测试集,8种ML模型10倍交叉验证。结果Boruta算法筛选出8个重要特征变量,包括CTQ-SF、BPRS、HDL、SES、MLR、PANSS阳性症状评分、PANSS一般精神病理评分和PLR。其中,XGBoost模型在ROC曲线中的AUC值最高。CTQ-SF、BPRS和HDL是预测攻击行为风险最重要的三个特征变量。结论XGBoost模型在预测攻击行为风险方面具有较高的准确性和临床价值,通过SHAP值解释,提升了模型的透明性和解释性,有助于临床医生更好地理解模型预测结果。 展开更多
关键词 精神分裂症 机器学习 Boruta算法 shapley加性解释 风险预测
暂未订购
基于HA-RF-SHAP的露天煤矿安全监测系统设计
13
作者 臧建领 张伟 《电子设计工程》 2026年第5期86-90,共5页
由于现有露天煤矿系统监测效果不符合预期,该文设计一套基于HA-RF-SHAP的露天煤矿安全监测系统。系统硬件设计采用微处理器作为主控制器,由数字处理模块进行数据采集;软件设计部分通过启发式算法优化随机森林模型的超参数,利用随机森林... 由于现有露天煤矿系统监测效果不符合预期,该文设计一套基于HA-RF-SHAP的露天煤矿安全监测系统。系统硬件设计采用微处理器作为主控制器,由数字处理模块进行数据采集;软件设计部分通过启发式算法优化随机森林模型的超参数,利用随机森林进行粉尘浓度的预测,并通过SHAP值分析影响粉尘浓度的关键因素。设定坡面顶底线作为露天矿坑台阶的界线,运用矿区DEM自动提取坡面特征线的方法,明确开采边界,避免越界开采。测试结果表明,A1-A5五个监测点的沉降数据展现出较为平稳的趋势,且三个小组的沉降量均小于600 mm;当温度为21.3℃时,6个小组的可燃粉尘浓度维持在20.56~26.86 g/m^(3)之间,结果符合预期要求。根据监测数据,能够实时掌握边坡的变形情况,准确预测露天煤矿粉尘浓度,从而有效控制可燃物并预防爆炸等安全事故。 展开更多
关键词 HA-RF-shap 露天煤矿 安全监测 主控制器 坡面特征线
在线阅读 下载PDF
基于机器学习和SHAP算法的我国粮食安全水平测度重构及可解释性分析 被引量:5
14
作者 王火根 胡梦婷 刘小春 《中国农业大学学报》 北大核心 2025年第7期264-274,共11页
为探讨“大食物观”对中国粮食安全赋予的新内涵,基于2010—2022年中国省级层面数据,从生产安全、质量安全、经济安全、消费安全和流通安全5个维度构建中国粮食安全评价指标体系,在熵值法测算基础上,利用机器学习和SHAP算法重新识别不... 为探讨“大食物观”对中国粮食安全赋予的新内涵,基于2010—2022年中国省级层面数据,从生产安全、质量安全、经济安全、消费安全和流通安全5个维度构建中国粮食安全评价指标体系,在熵值法测算基础上,利用机器学习和SHAP算法重新识别不同影响变量对粮食安全的重要性。结果表明:1)从整体演进趋势来看,2010—2022年中国粮食安全水平总体呈先下降后上升的态势,于2012—2015年和2018—2019年增长迅速;2)从各维度评价得分来看,生产安全对粮食安全贡献度最高,经济安全和质量安全呈上升趋势,消费安全和流通安全是粮食安全体系中的薄弱环节;3)从粮食安全的关联因素来看,影响中国粮食安全水平的关键因素包括肉类总产量、粮食总产量、水产品总产量、铁路货运量、财政涉农支出、森林覆盖率和城乡收入差距。基于此,从推动畜牧业可持续发展,提高粮食生产效率,加强水产养殖发展,加大财政涉农支出等4个方面提出政策建议。 展开更多
关键词 大食物观 XGBoost shap 粮食安全 食物安全
原文传递
融合XGBoost-SHAP的重庆市乡村生态旅游资源竞争力测度研究 被引量:8
15
作者 张慧玲 张虹 孙德亮 《长江流域资源与环境》 北大核心 2025年第3期585-599,共15页
乡村生态旅游资源竞争力是判别旅游发展潜力的重要依据,对乡村产业振兴有重要意义。XGBoost-SHAP解释性机器学习为乡村生态旅游资源竞争力测度提供可视化的智能工具。融合XGBoost-SHAP构建可解释的机器学习模型,以乡村生态旅游资源点为... 乡村生态旅游资源竞争力是判别旅游发展潜力的重要依据,对乡村产业振兴有重要意义。XGBoost-SHAP解释性机器学习为乡村生态旅游资源竞争力测度提供可视化的智能工具。融合XGBoost-SHAP构建可解释的机器学习模型,以乡村生态旅游资源点为样本,从自然人文环境、生态资源和旅游基础设施3个维度选择测度指标,以识别重庆市乡村生态旅游资源竞争力水平。结果表明:(1)XGBoost通过学习样本数据潜在模式或规律,高效的识别了乡村生态旅游地的不同竞争力水平,并实现了较高的精度。(2)SHAP提高了XGBoost模型预测的透明度,能识别乡村生态旅游资源竞争力的主导因子,经济活动强度、NDVI、高程和生境质量是对重庆市乡村生态旅游资源竞争力最重要的4个因子,同时也是乡村生态旅游资源开发与可持续利用的主要考量因素。(3)重庆市乡村生态旅游资源强竞争力区域集中在市场、知名景区和交通沿线附近,形成了重庆市西部市场依托、东南和东北部为交通依托和景区依托3种乡村生态旅游发展模式。(4)资源竞争力具有空间溢出效应,距离核心景区远近是影响其强弱的主要因素,旅游基础设施和市场等人文条件也对其产生重要影响。最后,基于研究结论,对平衡重庆市旅游资源的开发与利用,优化旅游空间布局,以及推动“和美乡村”建设方面提供建议。可解释性机器学习模型能快速、准确测度区域乡村生态旅游资源竞争力,可以为旅游资源识别和定量分析提供方法借鉴。 展开更多
关键词 生态旅游资源 乡村 竞争力 XGBoost-shap 重庆市
原文传递
基于XGBoost⁃SHAP方法的建设项目碳排放空间异质性分析 被引量:4
16
作者 王元庆 李佳玥 +1 位作者 刘备 王芳 《环境科学》 北大核心 2025年第7期4090-4100,共11页
为使公路建设碳减排更有效,聚焦高速公路建设过程中的碳排放空间异质性,基于广东省A高速公路项目40个分段样本筛选出的构造物类型、桥隧比、设计坡度、路线长度、填方量、挖方量和水泥消耗量这7个碳排放影响关键指标,训练与验证了XGBoos... 为使公路建设碳减排更有效,聚焦高速公路建设过程中的碳排放空间异质性,基于广东省A高速公路项目40个分段样本筛选出的构造物类型、桥隧比、设计坡度、路线长度、填方量、挖方量和水泥消耗量这7个碳排放影响关键指标,训练与验证了XGBoost碳排放预测模型,构建了解释这40个路段碳排放空间异质性的SHAP算法,研究了路段特征对碳排放的影响、总特征贡献和特征交互效应.结果表明,水泥消耗量的增加对碳排放的非线性增长贡献最大,路线长度、挖方量和桥隧比对碳排放的贡献度也较为显著;冷热点分析发现坡度高于2.5%且地形复杂的路段碳排放趋高,存在聚集效应;XGBoost-SHAP模型较地理加权回归模型GWR能更清晰解释碳排放的空间分布特征及其影响因素,在捕捉关键碳源和理解碳排放空间分布特征方面表现更佳.基于以上发现,提出了公路建养碳减排的针对性综合策略,以推动公路建设的可持续发展. 展开更多
关键词 碳排放 空间异质性 XGBoost算法 shap算法 可解释性
原文传递
基于特征工程优化和SHAP解释方法预测圆钢管约束混凝土短柱轴压承载力 被引量:3
17
作者 韦建刚 吴洵桢 +1 位作者 郑裔 杨艳 《东南大学学报(自然科学版)》 北大核心 2025年第5期1328-1336,共9页
以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构... 以钢管约束混凝土(STCC)短柱为研究背景,聚焦于数据和特征的选择与前处理、模型的可视化应用以及特征重要性分析,探究机器学习“黑匣子”背后的预测过程。以154根圆STCC短柱为例,进行学习并预测其极限承载力N_(u)。讨论了STCC短柱结构中常见的9个特征的相关性以及冗余性,从13个机器学习模型中筛选出梯度提升树(GBDT)、随机森林(Random Forest)、极端梯度提升(XGBoost)和极端随机树(Extra Trees)四个最优模型对STCC的极限轴压承载力N_(u)进行预测,并采用SHAP可解释方法对4种模型进行可视化对比分析。研究表明:截面含钢率α在统计分析中方差趋于零且与径厚比B/t呈完全负相关关系;约束效应系数ζ在F检验中与N_(u)的显著性水平小于5%,斯皮尔曼、皮尔森以及互信息量相关性分析均表明其与N_(u)弱相关。通过SHAP方法对上述4种模型可视化发现,XGBoost在测试集上的表现尤为突出,其决定系数R^(2)(0.9626)、均方根误差(287.40 kN)、平均绝对误差(139.13 kN)以及平均绝对百分比误差(5.1%)均为4个模型中的最低值。此外,XGBoost在泛化能力和避免过拟合方面也表现出色,因此更适用于STCC短柱轴压承载力预测。 展开更多
关键词 机器学习 特征工程 shap解释方法 圆钢管约束混凝土 轴压承载力 特征重要性分析
在线阅读 下载PDF
基于LightGBM和SHAP算法的致密油储层孔隙度预测 被引量:2
18
作者 王伟 党海龙 +3 位作者 康胜松 肖前华 丁磊 石立华 《油气地质与采收率》 北大核心 2025年第5期90-99,共10页
为了准确高效地表征致密油储层孔隙度的空间分布特征,同时对机器学习模型的可解释性进行评价,采用Z-Score方法对特征属性进行归一化处理,并应用Optuna超参数优化框架对模型的超参数进行调优,建立了一种基于LightGBM算法的孔隙度预测模型... 为了准确高效地表征致密油储层孔隙度的空间分布特征,同时对机器学习模型的可解释性进行评价,采用Z-Score方法对特征属性进行归一化处理,并应用Optuna超参数优化框架对模型的超参数进行调优,建立了一种基于LightGBM算法的孔隙度预测模型,与GBDT和XGBoost算法模型进行了预测效果的综合对比,并利用SHAP算法对LightGBM模型的输出结果进行了可视化解释分析。研究结果表明:LightGBM模型在训练数据集和测试数据集上的预测决定系数分别为0.984和0.855,模型预测准确度高、泛化能力强,综合预测效果好于GBDT和XGBoost模型。应用SHAP算法对LightGBM模型结果的可解释性进行分析,结果表明,影响LightGBM孔隙度预测模型最重要的5项测井参数为密度、阵列感应电阻率、自然伽马、声波时差和光电吸收截面指数。在研究区某单井X致密层段孔隙度的预测实例中,LightGBM模型预测准确度达93.9%,分别高于GBDT和XGBoost模型的预测准确度86.53%和89.08%;训练时长为0.016 s,分别为GBDT和XGBoost模型训练时长的0.096倍和0.025倍;预测时长为0.01 s,分别为GBDT和XGBoost模型预测时长的0.42倍和0.19倍;LightGBM模型的预测效率相对GBDT和XGBoost模型具有明显优势,其在取心井段上对孔隙度的预测误差更小,预测能力更强,且能更好地拟合低值孔隙度。该方法的应用不仅解决了单井致密层段获取完整准确孔隙度分布的难题,而且提高了孔隙度预测的精度和效率,对致密油储层的评价及高效勘探开发具有一定的参考价值。 展开更多
关键词 致密油储层 机器学习 LightGBM算法 shap算法 孔隙度预测
在线阅读 下载PDF
一种兼具精度与可解释性的Stacking-SHAP滑坡易发性预测集成方法 被引量:1
19
作者 黄鑫 叶健 +3 位作者 刘骋冰 曾秋雨 郭万新 郭志凯 《测绘学报》 北大核心 2025年第10期1826-1840,共15页
滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性... 滑坡易发性预测及诱因分析对于制定科学有效的滑坡灾害防治策略至关重要。然而,当前仍缺乏能够兼具高预测精度与可解释性的滑坡预测模型。为此,本文提出了一种基于可解释性增强的集成学习方法,构建Stacking-SHAP模型,以提升滑坡易发性预测的准确性与诱因分析的可靠性。本文方法采用Stacking集成框架,融合XGBoost、CatBoost、LightGBM、逻辑回归(LR)、随机森林(RF)等多种机器学习分类器,在保证预测精度的基础上,引入SHAP(shapley additive explanations)算法,以增强模型的可解释性。试验结果表明,Stacking-SHAP模型的AUC值达到0.920,显著优于单一分类器模型,如XGBoost(0.893)、CatBoost(0.894)、LightGBM(0.879)、RF(0.859)和LR(0.794)。更重要的是,相较于SHAP集成单一机器学习模型,Stacking-SHAP可解释增强集成模型在滑坡诱因分析方面表现出更优的综合性能,提高了滑坡致灾因素分析的可信度。整体而言,本文方法兼具高精度预测与高可靠性解释,为滑坡易发性预测与诱因分析提供了一种创新性方法,在滑坡防治与减灾领域具有重要的理论与应用价值。 展开更多
关键词 滑坡易发性 地理大数据 Stacking算法 shap算法 滑坡诱因分析
在线阅读 下载PDF
大运河文化带新质生产力的时空分异特征与影响因素——基于机器学习XGBoost-SHAP模型 被引量:3
20
作者 周丙锋 史静 +2 位作者 谢新水 刘晟 曹倩倩 《地域研究与开发》 北大核心 2025年第1期14-22,共9页
采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现... 采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现波动增长态势,相比于绿色生产力、科技生产力,数字生产力占新质生产力比例更大。各地区新质生产力发展水平存在一定差异,北京、江苏、浙江部分地级市为新质生产力发展高峰,河南、安徽为新质生产力发展低谷,且2020年各地新质生产力水平均有所提升。其聚集效应沿大运河呈现“三角”分布现象,且表现出“两角聚集夹分异”的发展趋势。每百人移动电话用户数、全要素劳动生产率等为影响大运河文化带新质生产力水平的主导因素,且各个主导因素之间存在交互效应。 展开更多
关键词 新质生产力 大运河文化带 时空分异 XGBoost-shap模型
在线阅读 下载PDF
上一页 1 2 49 下一页 到第
使用帮助 返回顶部