期刊文献+
共找到170篇文章
< 1 2 9 >
每页显示 20 50 100
大运河文化带新质生产力的时空分异特征与影响因素——基于机器学习XGBoost-SHAP模型 被引量:3
1
作者 周丙锋 史静 +2 位作者 谢新水 刘晟 曹倩倩 《地域研究与开发》 北大核心 2025年第1期14-22,共9页
采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现... 采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现波动增长态势,相比于绿色生产力、科技生产力,数字生产力占新质生产力比例更大。各地区新质生产力发展水平存在一定差异,北京、江苏、浙江部分地级市为新质生产力发展高峰,河南、安徽为新质生产力发展低谷,且2020年各地新质生产力水平均有所提升。其聚集效应沿大运河呈现“三角”分布现象,且表现出“两角聚集夹分异”的发展趋势。每百人移动电话用户数、全要素劳动生产率等为影响大运河文化带新质生产力水平的主导因素,且各个主导因素之间存在交互效应。 展开更多
关键词 新质生产力 大运河文化带 时空分异 XGBoost-shap模型
在线阅读 下载PDF
基于XGBoost-SHAP可解释机器学习模型的城市形态与地表温度的关系 被引量:13
2
作者 谭洁 危千骏 +3 位作者 廖朝阳 邝文俊 邓慧婷 余德 《应用生态学报》 北大核心 2025年第3期659-670,共12页
随着全球大城市中高层建筑的增多,探讨城市二维(2D)和三维(3D)形态对地表温度(LST)的影响,已成为缓解城市热环境和优化城市规划的关键。本研究以长沙市三环以内地区为例,基于2020年多源遥感数据提取了13项城市2D/3D特征因子,通过Pearso... 随着全球大城市中高层建筑的增多,探讨城市二维(2D)和三维(3D)形态对地表温度(LST)的影响,已成为缓解城市热环境和优化城市规划的关键。本研究以长沙市三环以内地区为例,基于2020年多源遥感数据提取了13项城市2D/3D特征因子,通过Pearson相关性分析探讨LST与各特征因子的线性关系,并引入XGBoost模型和SHAP方法揭示其非线性影响和贡献。结果表明:2020年,高温区域主要分布在长沙市中心的建筑密集区,低温区域主要分布在长沙市西部和东北部的森林公园以及湘江沿岸。归一化建筑指数(NDBI)、夜间灯光(NTL)和建设用地比例(PCL)与LST呈显著正相关关系,相关系数分别为0.592、0.537和0.446,表明城市化进程加剧了地表升温;归一化植被指数(NDVI)、天空视角系数(SVF)与LST呈显著负相关关系,相关系数分别为-0.316和-0.200,体现了绿地和开阔空间对缓解城市热岛的重要作用。NDBI、NTL、NDVI和高程(DEM)对LST的影响最大,总贡献度达60.9%;这些2D/3D形态特征因子对LST的影响呈现复杂的非线性特征,其中,NDBI在0~0.2时,对LST提升最显著;NTL超过40后的增温效应趋于饱和;NDVI超过0.5时,降温效果显著增强;DEM在50~150 m对LST的降温效果最突出。本研究验证了XGBoost-SHAP模型揭示城市2D/3D特征因子对LST的非线性影响机制的有效性,并可为城市热环境治理与缓解,以及绿色、低碳、宜居的新型城镇化建设提供科学依据。 展开更多
关键词 城市2D/3D形态 热岛效应 可解释机器学习 XGBoost-shap模型
原文传递
基于CatBoost-SHAP-MCM模型的关中地区PM_(2.5)浓度的气象影响因素研究 被引量:1
3
作者 苏佳 聂达文 +3 位作者 李晓萌 张新生 宋金昭 董明放 《环境科学研究》 北大核心 2025年第4期787-797,共11页
为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同... 为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同时利用CatBoost-SHAP-MCM模型识别PM_(2.5)浓度的关键气象影响因素。结果表明:①关中地区PM_(2.5)浓度呈明显的空间分布和季节变异性。年际PM_(2.5)浓度在2021年最低,为42.93μg/m^(3),在2022年最高,达49.09μg/m^(3)。季度和月际变化较为相似,均呈冬季高、夏季低的特征,冬季污染最严重,PM_(2.5)浓度达84.35μg/m^(3),夏季最轻,为21.42μg/m^(3)。西安市、咸阳市和渭南市为高污染城市,铜川市和宝鸡市为低污染城市。②PM_(2.5)浓度与PM10浓度的相关性最高,与CO浓度、SO2浓度相关性均较低。③露点温度、气温、海平面气压、降水量和地面气压为关键气象影响因素,其在各城市表现出显著的影响作用,对关中地区整体和各城市的影响基本保持一致。④在低露点温度、低气温以及低露点温度、高海平面气压和高地面气压等特定因素组合下,其对PM_(2.5)浓度的影响更为显著。研究显示,关中地区PM_(2.5)浓度具有明显的空间分异特征和季节性变化特征,且与露点温度、气温、海平面气压、降水量和地面气压等气象因素密切相关,在特定气象组合条件下PM_(2.5)浓度波动更为显著。 展开更多
关键词 关中地区 PM_(2.5) 影响因素 CatBoost-shap-MCM模型
在线阅读 下载PDF
An Interpretable Prediction Model for Stroke Based on XGBoost and SHAP
4
作者 Tianshu Fang Jiacheng Deng 《Journal of Clinical and Nursing Research》 2023年第3期96-106,共11页
Objective:To establish a stroke prediction and feature analysis model integrating XGBoost and SHAP to aid the clinical diagnosis and prevention of stroke.Methods:Based on the open data set on Kaggle,with the help of d... Objective:To establish a stroke prediction and feature analysis model integrating XGBoost and SHAP to aid the clinical diagnosis and prevention of stroke.Methods:Based on the open data set on Kaggle,with the help of data preprocessing and grid parameter optimization,an interpretable stroke risk prediction model was established by integrating XGBoost and SHAP and an explanatory analysis of risk factors was performed.Results:The XGBoost model’s accuracy,sensitivity,specificity,and area under the receiver operating characteristic(ROC)curve(AUC)were 96.71%,93.83%,99.59%,and 99.19%,respectively.Our explanatory analysis showed that age,type of residence,and history of hypertension were key factors affecting the incidence of stroke.Conclusion:Based on the data set,our analysis showed that the established model can be used to identify stroke,and our explanatory analysis based on SHAP increases the transparency of the model and facilitates medical practitioners to analyze the reliability of the model. 展开更多
关键词 Stroke risk prediction XGBoost algorithm shap model Risk factor analysis
暂未订购
基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型
5
作者 盛武 王灵子 《工矿自动化》 北大核心 2025年第6期21-27,140,共8页
针对目前综采工作面上隅角瓦斯浓度预测模型由于“黑盒”结构导致内部运行逻辑未知、预测结果可解释性弱的问题,提出一种基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型。对综采工作面瓦斯涌出浓度关联监测数据进行相关分析,筛选出特... 针对目前综采工作面上隅角瓦斯浓度预测模型由于“黑盒”结构导致内部运行逻辑未知、预测结果可解释性弱的问题,提出一种基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型。对综采工作面瓦斯涌出浓度关联监测数据进行相关分析,筛选出特征变量;基于XGBoost搭建上隅角瓦斯浓度预测模型,引入SHAP算法计算每个特征变量对预测结果的贡献值,增强模型透明度,为XGBoost提供全局性解释;最后利用现场多源传感监测数据对模型性能进行验证。实例分析结果表明:①XGBoost模型的决定系数R^(2)、平均绝对误差(MAE)、均方根误差(RMSE)分别为0.93,0.007,0.008,相较于随机森林(RF)、支持向量回归(SVR)和梯度提升决策树(GBDT),拟合优度最高,误差最低。②XGBoost模型的平均相对误差为4.478%,相较于对比模型,具有较高的精度与较好的泛化性能。③依据各输入特征的平均绝对SHAP值,工作面T1瓦斯浓度对上隅角瓦斯浓度影响最大,工作面上隅角瓦斯抽采管道内瓦斯浓度次之,回采煤层瓦斯含量、回采煤层顶板压力等紧随其后,说明XGBoost能捕捉变量间的非线性关系和交互作用,SHAP算法可为XGBoost模型提供全局性解释。 展开更多
关键词 瓦斯浓度预测 上隅角瓦斯溯源 XGBoost模型 shap 可解释性
在线阅读 下载PDF
应用SHAP可解释机器学习模型估测森林蓄积量 被引量:3
6
作者 王元 王玥 +3 位作者 周宇琛 陈伏生 张绿水 刘牧 《东北林业大学学报》 北大核心 2025年第5期66-73,共8页
森林蓄积量是反映森林资源丰富程度的关键指标,精确估测森林蓄积量对于森林资源管理至关重要。以江西省林区为研究对象,运用谷歌地球引擎(Google Earth Engine)平台从Landsat 8遥感影像中提取多个植被指数、单波段及组合特征,并结合国... 森林蓄积量是反映森林资源丰富程度的关键指标,精确估测森林蓄积量对于森林资源管理至关重要。以江西省林区为研究对象,运用谷歌地球引擎(Google Earth Engine)平台从Landsat 8遥感影像中提取多个植被指数、单波段及组合特征,并结合国家森林资源连续清查的地面实测数据,分析不同影像特征参数在森林蓄积量反演中的贡献率。结果表明:对比多元线性回归、神经网络、随机森林和XGBoost模型估测森林蓄积量的精度,随机森林模型估测精度为93.3%,决定系数(R^(2))为0.9337,均方根误差为2.2323,平均绝对误为2.3395;与BP神经网络模型(R^(2)=0.8219)和XGBoost模型(R^(2)=0.7916)相比,模型拟合度和预测效果更佳,比多元线性回归模型(R^(2)=0.688)处理非线性关系的稳定性和可靠性更高。通过解释特征参数的相对重要性,揭示出平均胸径、郁闭度等特征对森林蓄积量影响显著,且随机森林模型中各因子间存在相互作用。 展开更多
关键词 shap解释模型 机器学习模型 森林蓄积量
在线阅读 下载PDF
基于XGBoost-SHAP方法的陕西省PM_(2.5)影响因素分析 被引量:8
7
作者 赵兴赟 张强 +4 位作者 杨方社 郑烈龙 罗嘉昕 史治辉 问思路 《环境科学研究》 北大核心 2025年第5期990-999,共10页
陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气... 陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气污染物数据集,对陕西省PM_(2.5)浓度的时空变化特征进行研究,通过构建XGBoost模型并结合SHAP方法,分析陕西省PM_(2.5)浓度与气象、地形及植被因素和社会经济因素的关系,阐明各因素对PM_(2.5)浓度的时空影响。结果表明:①时间上,2013−2022年陕西省PM_(2.5)浓度整体呈现下降趋势,年均浓度最大值(56.02μg/m^(3))出现在2013年,在2019−2022年PM_(2.5)年均浓度低于《环境空气质量标准》(GB 3095−2012)二级标准限值(35μg/m^(3));空间上,陕西省呈现“关中高、陕南和陕北低”的污染空间格局。②在所研究的影响因素中,XGBoost-SHAP方法揭示了影响陕西省PM_(2.5)浓度的主要因素依次为高程、相对湿度、温度和人口密度,其中,高程和相对湿度对陕西省PM_(2.5)浓度具有负向影响,而温度和人口密度则表现为正向影响。③通过划分影响区发现,陕北、关中及陕南地区PM_(2.5)主要影响因素的作用方向与影响强度存在显著的空间异质性。研究显示,2013−2022年陕西省PM_(2.5)浓度大幅下降,PM_(2.5)的主要影响因素在不同区域存在空间差异,治理PM_(2.5)污染需要综合考虑区域异质性与多重影响因素的协同作用。 展开更多
关键词 PM_(2.5) XGBoost模型 shap方法 时空特征 影响因素
在线阅读 下载PDF
基于机器学习和SHAP算法的声波测井曲线重构及可解释性分析 被引量:8
8
作者 黎子豪 蒋恕 《地质科技通报》 北大核心 2025年第1期321-331,共11页
测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间... 测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间的关系模型使得曲线重构精度相对较低,机器学习算法虽能在大量数据之间找到最为合适的数据映射关系进而提高模型精度,但相较而言其所构建的黑箱模型无法得到良好的解释。近期,可解释性算法的运用使得机器学习在重构测井曲线中的应用更为合理。通过将支持向量回归(support vector regression,简称SVR),随机森林(random forest,简称RF)以及极限梯度提升(extreme gradient boosting,简称XGBoost)和传统多元线性回归方法(linear regression,简称LR)的对比对英国能源局22-30b-11号井声波测井曲线进行了模型重构并基于shapley additive explanations(SHAP)算法对XGBoost模型进行了解释。结果表明,XGBoost在测试集上的决定系数(R2)和均方误差(MSE)分别为0.996,6.371,优于SVR的0.990、15.755和RF的0.993、9.871,而传统多元线性回归方法则为0.969、48.895,表明XGBoost对声波时差曲线的重构具有更高的准确度和更好的泛化性能。创新性地采用SHAP算法对XGBoost黑箱模型的解释表明,在模型构建选择重要特征时,XGBoost模型采用地层温度数据作为特征明显合理于多元线性回归方法采用的井径测井数据。最后基于SHAP对模型进行了单点和全局特征交互解释。上述结果表明在声波测井曲线重构方面,机器学习算法明显优于传统的多元线性回归方法,并证明了SHAP算法在声波测井曲线重构机器学习模型解释方面的可行性,为后续机器学习在测井解释中的发展提供了新的思路。 展开更多
关键词 测井曲线重构 机器学习 模型解释 shap算法 声波测井
在线阅读 下载PDF
基于特征选择的SHAP-Transformer高炉铁水硅含量预报模型 被引量:3
9
作者 马居安 郑华伟 +4 位作者 刘栋梁 陆昊 周进东 毕学工 熊玮 《钢铁》 北大核心 2025年第8期68-78,共11页
数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal c... 数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal component analysis,PCA)将22个分钟级的特征参数转化为铁次级参数,进一步采用滑动窗口和最大信息系数(maximal information coefficient,Cimax)确定了参数的滞后时长。利用随机森林优化的SHAP算法对34个参数在强耦合条件下的重要性进行评估,筛选出7个关键参数。使用SHAP算法优化Transformer的自注意力机制,构建了SHAP-Transformer铁水硅含量预报模型,通过现场数据验证了模型的有效性。结果表明,铁水硅质量分数预测误差为-0.05~0.05和-0.1~0.1时,基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型的命中率最高,分别为72.12%和95.76%,比基于MIC参数选择的SHAP-Transformer模型提高了26.67%和21.21%,比基于滑动窗口时滞分析及耦合参数优选的长短时记忆网络(long short-term memory,LSTM)模型提高了17.57%和9.7%。基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型对铁水硅含量的变化趋势预测也有较高的精度,趋势方向预测的准确率为87.3%,趋势类别预测的准确率为60.5%,研究能够为高炉操作者提前判断炉温变化提供可靠依据。 展开更多
关键词 高炉 铁水硅含量 特征选择 时滞分析 随机森林 shap算法 炼铁 预报模型
原文传递
基于CatBoost-SHAP模型的建成环境对城市活力影响机制——以西安市主城区为例
10
作者 刘蓓 胡新玲 何浩 《地理与地理信息科学》 北大核心 2025年第6期7-15,共9页
城市活力作为中国城市可持续发展的重要表征,与建成环境之间呈现复杂关系。该文以西安市主城区为研究区,基于百度热力图测度城市活力,并构建“5D”建成环境评价指标体系,运用CatBoost-SHAP模型与GeoVisX空间可视化技术解析建成环境对城... 城市活力作为中国城市可持续发展的重要表征,与建成环境之间呈现复杂关系。该文以西安市主城区为研究区,基于百度热力图测度城市活力,并构建“5D”建成环境评价指标体系,运用CatBoost-SHAP模型与GeoVisX空间可视化技术解析建成环境对城市活力在工作日和休息日的影响机制。结果表明:西安市主城区工作日与休息日城市活力特征不同,工作日呈单峰特征,休息日则表现为双峰特征,整体活力水平高于工作日;建成环境对城市活力的影响呈现明显的空间异质性,中心区域作用显著强于外围区域,但商业设施密度与交通设施密度为持续性关键要素;建成环境因素与城市活力间存在非线性关系及阈值效应,不同建成环境因素间具有协同效应,表明城市活力的形成源于多因子耦合作用。研究结果揭示了建成环境因素对城市活力影响的空间异质性规律、非线性特征以及双指标协同效应,可为提升城市活力提供科学依据。 展开更多
关键词 城市活力 建成环境 CatBoost-shap模型 空间可视化 非线性关系
在线阅读 下载PDF
基于XGBoost-SHAP的三峡库区生态屏障区生态系统服务权衡及驱动力分析
11
作者 杨佳 斛如媛 +4 位作者 赵海平 勾蒙蒙 欧阳帅 刘常富 肖文发 《水土保持学报》 北大核心 2025年第6期127-138,共12页
[目的]探究三峡库区生态屏障区生态系统服务权衡及其驱动因素,为区域生态系统综合管理和生态安全保障提供科学依据。[方法]基于三峡库区生态屏障区2000-2023年土地利用/覆被数据、气象数据、土壤数据等地理多源数据,运用CASA、RUSLE和In... [目的]探究三峡库区生态屏障区生态系统服务权衡及其驱动因素,为区域生态系统综合管理和生态安全保障提供科学依据。[方法]基于三峡库区生态屏障区2000-2023年土地利用/覆被数据、气象数据、土壤数据等地理多源数据,运用CASA、RUSLE和InVEST等模型系统评估产水服务、碳固存、土壤保持、生境维持和水质净化5种典型生态系统服务,探讨各生态系统服务间权衡与协同关系,并进一步利用XGBoost-SHAP模型揭示生态系统服务权衡关键驱动因子。[结果] 1)产水服务、碳固存和土壤保持服务在2000-2023年呈先下降后增加的趋势,而生境质量、水质净化则呈下降趋势;在空间上,产水服务、生境维持、土壤保持、水质净化高值区主要分布在中部、东部,碳固存则表现为由中部向东西两侧递减。2)5种生态系统服务之间整体以协同关系为主,协同区主要分布在生态屏障区中部及海拔较高、植被覆盖度高的区域,而权衡区主要分布在河流两岸区域、西部的重庆城市区及东部邻近宜昌城区的区域。3)降水增长率、坡度、海拔及植被盖度是决定生态系统服务权衡关系的主要驱动因子,其影响存在阈值效应,而人口密度在一定程度上加剧生态系统服务之间的权衡关系。[结论]在今后生态屏障区的生态修复工程中,应更加关注自然和人为驱动对权衡关系的非线性影响和阈值效应,以更加精准地实现生态系统服务的多功能提升。 展开更多
关键词 生态系统服务 权衡与协同 XGBoost-shap模型 驱动因素 三峡库区生态屏障区
在线阅读 下载PDF
良性前列腺增生并发膀胱结石的危险因素分析及基于SHAP的可解释性预测模型构建
12
作者 赵欢 欧阳松 +1 位作者 董洪超 王勤章 《现代泌尿外科杂志》 2025年第8期653-661,共9页
目的探讨良性前列腺增生(BPH)患者并发膀胱结石(BS)的独立危险因素,构建预测模型和部署便于使用的网站。方法回顾性分析2022年1月—2025年1月石河子大学第一附属医院泌尿外科收治的460例BPH患者的临床资料,通过单因素逻辑回归结合Borut... 目的探讨良性前列腺增生(BPH)患者并发膀胱结石(BS)的独立危险因素,构建预测模型和部署便于使用的网站。方法回顾性分析2022年1月—2025年1月石河子大学第一附属医院泌尿外科收治的460例BPH患者的临床资料,通过单因素逻辑回归结合Boruta算法共同识别训练集患者中BPH并发BS的独立危险因素,并基于危险因素构建列线图模型。通过受试者工作特征(ROC)曲线、灵敏度、特异度、阳性预测值(PPV)、阴性预测值(NPV)、F1指数、校准曲线和临床决策曲线(DCA)综合评价模型预测效能;使用SHAP算法评估不同变量对BPH并发BS的贡献度。并基于预测模型建立便于使用的网页。结果460例BPH患者中并发BS者144例(31.3%)。单因素逻辑回归结合Boruta算法共识别出中性粒细胞占比、尿培养结果、膀胱内前列腺突出度(IPP)、尿亚硝酸盐检测结果、尿白细胞检测结果和尿潜血结果6个独立危险因素。测试集中,该列线图的ROC曲线下面积为0.887(95%CI:0.816~0.947),灵敏度、特异度、PPV、NPV和F1指数分别为0.705、0.968、0.912、0.876和0.795,校准曲线和DCA均展示出良好的区分能力和临床应用能力。SHAP结果显示IPP、尿白细胞检测结果、尿培养结果、中性粒细胞占比、尿亚硝酸盐检测结果和尿潜血结果是BPH并发BS最重要的危险因素。最终建立可公开访问的BPH并发BS诊断的网站(https://wutiaowu2.shinyapps.io/bladderrrr/)。结论中性粒细胞占比、尿培养结果、IPP、尿亚硝酸盐检测结果、尿白细胞检测结果和尿潜血结果是BPH并发BS的独立影响因素,基于此构建的模型及网页易用且准确度高,具有较高的临床实用价值。 展开更多
关键词 前列腺增生 膀胱结石 列线图 预测模型 shap算法
暂未订购
基于RFECV-XGBoost和SHAP的火电厂电力输灰预测模型
13
作者 刘文新 徐文辉 +4 位作者 陈朝晔 顾海英 温聪 姚雨龙 曾晰 《计算机与现代化》 2025年第4期63-69,共7页
火电厂电力输灰系统输灰产量的准确预测,对于整个火电发电效率的提升具有非常重要的意义。目前火电厂气力输灰系统主要依赖人工经验进行操作,基于此,提出一种基于XGBoost(极端梯度提升)和SHAP(沙普利加法解释)框架的智能输灰预测模型。... 火电厂电力输灰系统输灰产量的准确预测,对于整个火电发电效率的提升具有非常重要的意义。目前火电厂气力输灰系统主要依赖人工经验进行操作,基于此,提出一种基于XGBoost(极端梯度提升)和SHAP(沙普利加法解释)框架的智能输灰预测模型。首先,依托火电厂电力输灰系统的DCS系统,获取空气压力、设备温度等数据信息。其次,为了提升模型预测值准确度和防止过拟合,采用RFECV(交叉验证递归特征消除法)进行特征选择,随后将选择好的特征集导入XGBoost的智能输灰预测模型中,同时采用SHAP模型进行可视化的因果分析,进而从电力输灰数据中发现有用的信息,形成火电厂电力输灰系统的知识库,以达到更加智能高效的运行目标。研究结果可对火电厂输灰预警技术,输灰系统智能化升级方面提供数据支撑,有助于火电厂电力输灰系统节能降耗。 展开更多
关键词 火电厂 输灰预测 XGBoost模型 shap
在线阅读 下载PDF
利用SHAP框架揭示道路网选取中的特征重要性 被引量:3
14
作者 褚天舒 闫浩文 +1 位作者 禄小敏 李蓬勃 《地球信息科学学报》 北大核心 2025年第5期1068-1080,共13页
[目的]城市道路网选取是地图综合领域的重要研究方向之一,其中特征选择是影响选取准确性的关键环节。然而,随着新的特征指标不断提出,如何科学地选择特征成为了一直以来亟待解决的难题。[方法]本文引入了机器学习的可解释性框架—SHaple... [目的]城市道路网选取是地图综合领域的重要研究方向之一,其中特征选择是影响选取准确性的关键环节。然而,随着新的特征指标不断提出,如何科学地选择特征成为了一直以来亟待解决的难题。[方法]本文引入了机器学习的可解释性框架—SHapley加性解释(SHapley Additive exPlanations, SHAP),旨在分析道路网选取中的特征重要性,为特征选择提供新的解决方案。首先,通过文献统计的方式,研究选用了7种常见的特征作为研究对象,并以10个中国典型城市的1:25万和1:100万比例尺道路网数据为基础,构建包含7种特征指标的数据集。随后,利用LightGBM与XGBoost两种监督学习模型进行训练,并通过模型的评价指标对模型性能进行评估。最后,采用SHAP框架对2个模型进行解释,并分析特征间的相似性、作用方向及其重要性。[结果]在特征相似性方面,拓扑特征具有较强的相似性,“周边POI数量”与其他特征的相似性较低。在特征作用方向方面,“周边POI数量”和“交通流量”对模型的影响较为不稳定,而其他特征的高值通常有正向贡献。在特征重要性方面,XGBoost模型显示“等级”是最重要的特征,之后是“长度”和“交通流量”。而LightGBM模型的结果与XGBoost模型类似,表明模型对特征重要性影响较小。研究进一步基于本文的权重结果进行道路网选取,并将结果与标准数据进行对比,实验结果显示选取结果与标准数据有较高的一致性。[结论]本文提出了一种新的解决方案,用于道路网选取中的特征重要性分析,并为特征选择和特征赋权问题提供了参考依据。 展开更多
关键词 地图综合 城市道路网选取 shap框架 特征重要性 监督学习 XGBoost模型 LightGBM模型
原文传递
基于随机森林与SHAP算法的致密砂岩气暂堵效果的影响因素分析
15
作者 黄浩 车恒达 +3 位作者 孔祥伟 辛富斌 向九洲 吉俊杰 《科学技术与工程》 北大核心 2025年第26期11135-11143,共9页
为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂... 为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂堵效果量化模型和公式、暂堵效果算法模型验证,发现暂堵效果量化值与产气贡献率正相关,P=0.037,证明暂堵效果量化模型和公式的准确性高;又因暂堵效果算法模型中,训练集与测试集的MSE、MAE、R^(2)相差微小,证明该模型的泛化能力较强且准确性高。在暂堵效果算法模型的基础之上,开展暂堵效果的影响因素分析,结果表明:总段数、渗透率、暂堵球数量、簇间距和砂比这5个因素对于暂堵效果的影响占比最大。进一步分析单影响因素,发现随总段数增加,暂堵效果增加的规律只适用于直井,对水平井不适用;随渗透率增加,暂堵效果变差;暂堵球数量<50个、簇间距>20 m、砂比介于18%~20%,暂堵效果均可达到正向增长。研究结果可为苏里格等气田现场暂堵作业设计提供借鉴和参考。 展开更多
关键词 苏里格气田 致密砂岩气 暂堵效果 随机森林 shap(shapley additive explanations)值 模型解释
在线阅读 下载PDF
基于XGBoost-SHAP模型的儿科医院门诊患者满意度分析
16
作者 颜艳梅 《信息与电脑》 2025年第8期139-144,共6页
分析儿科医院门诊满意度数据,可为儿科门诊的精准改进提供有针对性的意见与建议。研究依托儿科医院门诊患者满意度调查数据,剖析门诊患者满意度的基本状况,构建XGBoost机器学习模型。结合SHAP(SHapley Additive exPlanations)可解释性... 分析儿科医院门诊满意度数据,可为儿科门诊的精准改进提供有针对性的意见与建议。研究依托儿科医院门诊患者满意度调查数据,剖析门诊患者满意度的基本状况,构建XGBoost机器学习模型。结合SHAP(SHapley Additive exPlanations)可解释性分析方法,系统量化了影响满意度的关键因素,并分析了其在门诊科室和门诊类别上的分布差异。结果表明,等候排队时间、就诊程序及指引、服务效率和服务态度是满意度最低的三个指标。等候排队时间在时序上呈波动趋势,寒暑假期间满意度较高。XGBoost拟合模型效果良好,R^(2)达到0.77。SHAP分析得出最重要的三个因子为环境设施卫生等后勤、医生诊疗水平、服务效率和服务态度,并探讨了这三个因子之间的交互作用。结论:需从流程、能力、监测等多方面提升满意度,对发热门诊实施“闭环服务链”以减少患者等候时间;对急诊/发热门诊医护开展“沟通–技术”能力培训,增强沟通与专业技术能力;对连续三个月满意度较低的科室进行根因分析。 展开更多
关键词 门诊满意度 机器学习 XGBoost-shap模型 儿科医院
在线阅读 下载PDF
浙江省县域可持续发展空间分异及SHAP驱动因素分析
17
作者 李宇楠 《计算机应用文摘》 2025年第23期238-241,共4页
为探索精细化的可持续发展评价路径,文章融合多源数据,构建了浙江省县域尺度的可持续发展评价指标体系,并结合修正耦合协调模型与SHAP可解释机器学习方法,对全省90个区县的子系统耦合协调关系及其影响因素进行了综合分析。结果表明,浙... 为探索精细化的可持续发展评价路径,文章融合多源数据,构建了浙江省县域尺度的可持续发展评价指标体系,并结合修正耦合协调模型与SHAP可解释机器学习方法,对全省90个区县的子系统耦合协调关系及其影响因素进行了综合分析。结果表明,浙江省县域综合可持续发展能力呈现“东高西低、北高南低”的空间格局,耦合协调度则表现出明显的“核心—边缘”分异特征;单位GDP建设用地面积、人口密度与人均可支配收入相对水平是影响区域可持续发展的关键驱动因素。文章为“双碳”目标背景下的城市智能治理提供了科学方法与决策参考。 展开更多
关键词 区县可持续发展 耦合协调模型 shap 空间分异
在线阅读 下载PDF
基于SHAP特征选择与集成学习的路面结冰预测
18
作者 谭文明 姜瑞森 +2 位作者 文元勇 史斯萌 方志伟 《交通工程》 2025年第11期91-95,共5页
结合SHAP特征选择方法和集成学习框架构建结冰预测模型。首先,利用SHAP值分析了路面温度、降水强度等因素与路面结冰状态之间的联系,建立预测模型输入特征集。随后,融合XGBoost、支持向量机与随机森林等基础模型,构建基于Stacking集成... 结合SHAP特征选择方法和集成学习框架构建结冰预测模型。首先,利用SHAP值分析了路面温度、降水强度等因素与路面结冰状态之间的联系,建立预测模型输入特征集。随后,融合XGBoost、支持向量机与随机森林等基础模型,构建基于Stacking集成学习框架的路面结冰状态预测模型。然后利用对比消融实验测试模型性能。结果表明,与传统预测模型相比,集成模型能更有效地挖掘影响因素之间的内在联系,通过融合不同模型特点以准确预测路面结冰状态。 展开更多
关键词 交通安全 路面结冰 集成预测模型 shap特征选择
在线阅读 下载PDF
中国城市能源系统韧性差异与关键驱动因素
19
作者 郑小强 李梦悦 孙金祎 《经济问题》 北大核心 2026年第1期109-119,共11页
在能源转型压力下,科学评估和提升城市能源系统韧性,对于保障能源安全和维持城市稳定运行至关重要。基于抵抗能力、恢复能力和适应能力三个维度构建改进的中国城市能源系统韧性评价指标体系,测度并分析2004—2023年中国286个地级市的能... 在能源转型压力下,科学评估和提升城市能源系统韧性,对于保障能源安全和维持城市稳定运行至关重要。基于抵抗能力、恢复能力和适应能力三个维度构建改进的中国城市能源系统韧性评价指标体系,测度并分析2004—2023年中国286个地级市的能源系统韧性差异及驱动因素。研究表明:中国城市能源系统韧性及其抵抗能力、恢复能力、适应能力3个维度在研究时间段内均呈现上升趋势;基于系统聚类分析和基尼系数发现中国各类型城市能源系统的韧性水平具有显著差异,且主要来源于组间差异;全国及各类型城市能源系统韧性水平提升,但内部差距逐步扩大,呈现“整体增强、内部分化”的特征;通过机器学习和敏感性分析,识别出能源供应多样性、能源自给率、可再生能源发电占比是韧性提升的关键驱动因素,并强调了关键驱动因素在不同城市类型中的显著异质性。研究结果为提升中国城市能源系统韧性、实现均衡发展提供了理论启示和政策建议。 展开更多
关键词 城市能源系统韧性 基尼系数 核密度估计 XGBoost-shap模型 敏感性分析
在线阅读 下载PDF
基于SHAP-GA-XGBoost融合模型的北京公路货运量预测研究
20
作者 安海岗 孙晓蕾 《物流科技》 2025年第22期93-99,共7页
在北京市公路货运系统日益复杂且对城市经济与物流运转至关重要的背景下,精准预测北京市公路货运量,可为政府交通规划、能源结构调整及应急响应提供科学依据。因此,文章构建SHAP-GA-XGBoost融合模型以更精准的预测北京市公路货运量。首... 在北京市公路货运系统日益复杂且对城市经济与物流运转至关重要的背景下,精准预测北京市公路货运量,可为政府交通规划、能源结构调整及应急响应提供科学依据。因此,文章构建SHAP-GA-XGBoost融合模型以更精准的预测北京市公路货运量。首先,基于需求驱动、供给能力等五大维度,筛选出24个影响北京市公路货运量的初始指标,并使用混频数据模型与KNN反距离权重插值完成数据预处理;其次,利用SHAP值与沃德法筛选出15个关键特征变量,降低模型输入维度;最后,引入Halton低差异序列优化遗传算法初始种群分布,并利用遗传算法实现XGBoost模型的超参寻优。实证结果表明,SHAP-GA-XGBoost融合模型在E_(MAE)、E_(MAPE)等指标上显著优于BP、SVM、LSTM、LSSVM等对比模型,验证了特征工程与算法优化协同的有效性。 展开更多
关键词 shap方法 遗传算法 极限梯度提升模型 公路货运量
在线阅读 下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部