期刊文献+
共找到155篇文章
< 1 2 8 >
每页显示 20 50 100
大运河文化带新质生产力的时空分异特征与影响因素——基于机器学习XGBoost-SHAP模型 被引量:2
1
作者 周丙锋 史静 +2 位作者 谢新水 刘晟 曹倩倩 《地域研究与开发》 北大核心 2025年第1期14-22,共9页
采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现... 采用熵值法对大运河文化带的新质生产力进行测算,并深入探究其时空分异特征。基于极限梯度提升算法-可解释机器学习(XGBoost-SHAP)模型对影响因素进行研究,以探讨影响因素之间的交互效应。结果表明:大运河文化带新质生产力发展水平呈现波动增长态势,相比于绿色生产力、科技生产力,数字生产力占新质生产力比例更大。各地区新质生产力发展水平存在一定差异,北京、江苏、浙江部分地级市为新质生产力发展高峰,河南、安徽为新质生产力发展低谷,且2020年各地新质生产力水平均有所提升。其聚集效应沿大运河呈现“三角”分布现象,且表现出“两角聚集夹分异”的发展趋势。每百人移动电话用户数、全要素劳动生产率等为影响大运河文化带新质生产力水平的主导因素,且各个主导因素之间存在交互效应。 展开更多
关键词 新质生产力 大运河文化带 时空分异 XGBoost-shap模型
在线阅读 下载PDF
基于XGBoost-SHAP可解释机器学习模型的城市形态与地表温度的关系 被引量:6
2
作者 谭洁 危千骏 +3 位作者 廖朝阳 邝文俊 邓慧婷 余德 《应用生态学报》 北大核心 2025年第3期659-670,共12页
随着全球大城市中高层建筑的增多,探讨城市二维(2D)和三维(3D)形态对地表温度(LST)的影响,已成为缓解城市热环境和优化城市规划的关键。本研究以长沙市三环以内地区为例,基于2020年多源遥感数据提取了13项城市2D/3D特征因子,通过Pearso... 随着全球大城市中高层建筑的增多,探讨城市二维(2D)和三维(3D)形态对地表温度(LST)的影响,已成为缓解城市热环境和优化城市规划的关键。本研究以长沙市三环以内地区为例,基于2020年多源遥感数据提取了13项城市2D/3D特征因子,通过Pearson相关性分析探讨LST与各特征因子的线性关系,并引入XGBoost模型和SHAP方法揭示其非线性影响和贡献。结果表明:2020年,高温区域主要分布在长沙市中心的建筑密集区,低温区域主要分布在长沙市西部和东北部的森林公园以及湘江沿岸。归一化建筑指数(NDBI)、夜间灯光(NTL)和建设用地比例(PCL)与LST呈显著正相关关系,相关系数分别为0.592、0.537和0.446,表明城市化进程加剧了地表升温;归一化植被指数(NDVI)、天空视角系数(SVF)与LST呈显著负相关关系,相关系数分别为-0.316和-0.200,体现了绿地和开阔空间对缓解城市热岛的重要作用。NDBI、NTL、NDVI和高程(DEM)对LST的影响最大,总贡献度达60.9%;这些2D/3D形态特征因子对LST的影响呈现复杂的非线性特征,其中,NDBI在0~0.2时,对LST提升最显著;NTL超过40后的增温效应趋于饱和;NDVI超过0.5时,降温效果显著增强;DEM在50~150 m对LST的降温效果最突出。本研究验证了XGBoost-SHAP模型揭示城市2D/3D特征因子对LST的非线性影响机制的有效性,并可为城市热环境治理与缓解,以及绿色、低碳、宜居的新型城镇化建设提供科学依据。 展开更多
关键词 城市2D/3D形态 热岛效应 可解释机器学习 XGBoost-shap模型
原文传递
基于CatBoost-SHAP-MCM模型的关中地区PM_(2.5)浓度的气象影响因素研究
3
作者 苏佳 聂达文 +3 位作者 李晓萌 张新生 宋金昭 董明放 《环境科学研究》 北大核心 2025年第4期787-797,共11页
为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同... 为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同时利用CatBoost-SHAP-MCM模型识别PM_(2.5)浓度的关键气象影响因素。结果表明:①关中地区PM_(2.5)浓度呈明显的空间分布和季节变异性。年际PM_(2.5)浓度在2021年最低,为42.93μg/m^(3),在2022年最高,达49.09μg/m^(3)。季度和月际变化较为相似,均呈冬季高、夏季低的特征,冬季污染最严重,PM_(2.5)浓度达84.35μg/m^(3),夏季最轻,为21.42μg/m^(3)。西安市、咸阳市和渭南市为高污染城市,铜川市和宝鸡市为低污染城市。②PM_(2.5)浓度与PM10浓度的相关性最高,与CO浓度、SO2浓度相关性均较低。③露点温度、气温、海平面气压、降水量和地面气压为关键气象影响因素,其在各城市表现出显著的影响作用,对关中地区整体和各城市的影响基本保持一致。④在低露点温度、低气温以及低露点温度、高海平面气压和高地面气压等特定因素组合下,其对PM_(2.5)浓度的影响更为显著。研究显示,关中地区PM_(2.5)浓度具有明显的空间分异特征和季节性变化特征,且与露点温度、气温、海平面气压、降水量和地面气压等气象因素密切相关,在特定气象组合条件下PM_(2.5)浓度波动更为显著。 展开更多
关键词 关中地区 PM_(2.5) 影响因素 CatBoost-shap-MCM模型
在线阅读 下载PDF
基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型
4
作者 盛武 王灵子 《工矿自动化》 北大核心 2025年第6期21-27,140,共8页
针对目前综采工作面上隅角瓦斯浓度预测模型由于“黑盒”结构导致内部运行逻辑未知、预测结果可解释性弱的问题,提出一种基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型。对综采工作面瓦斯涌出浓度关联监测数据进行相关分析,筛选出特... 针对目前综采工作面上隅角瓦斯浓度预测模型由于“黑盒”结构导致内部运行逻辑未知、预测结果可解释性弱的问题,提出一种基于XGBoost−SHAP的综采工作面上隅角瓦斯溯源模型。对综采工作面瓦斯涌出浓度关联监测数据进行相关分析,筛选出特征变量;基于XGBoost搭建上隅角瓦斯浓度预测模型,引入SHAP算法计算每个特征变量对预测结果的贡献值,增强模型透明度,为XGBoost提供全局性解释;最后利用现场多源传感监测数据对模型性能进行验证。实例分析结果表明:①XGBoost模型的决定系数R^(2)、平均绝对误差(MAE)、均方根误差(RMSE)分别为0.93,0.007,0.008,相较于随机森林(RF)、支持向量回归(SVR)和梯度提升决策树(GBDT),拟合优度最高,误差最低。②XGBoost模型的平均相对误差为4.478%,相较于对比模型,具有较高的精度与较好的泛化性能。③依据各输入特征的平均绝对SHAP值,工作面T1瓦斯浓度对上隅角瓦斯浓度影响最大,工作面上隅角瓦斯抽采管道内瓦斯浓度次之,回采煤层瓦斯含量、回采煤层顶板压力等紧随其后,说明XGBoost能捕捉变量间的非线性关系和交互作用,SHAP算法可为XGBoost模型提供全局性解释。 展开更多
关键词 瓦斯浓度预测 上隅角瓦斯溯源 XGBoost模型 shap 可解释性
在线阅读 下载PDF
应用SHAP可解释机器学习模型估测森林蓄积量 被引量:1
5
作者 王元 王玥 +3 位作者 周宇琛 陈伏生 张绿水 刘牧 《东北林业大学学报》 北大核心 2025年第5期66-73,共8页
森林蓄积量是反映森林资源丰富程度的关键指标,精确估测森林蓄积量对于森林资源管理至关重要。以江西省林区为研究对象,运用谷歌地球引擎(Google Earth Engine)平台从Landsat 8遥感影像中提取多个植被指数、单波段及组合特征,并结合国... 森林蓄积量是反映森林资源丰富程度的关键指标,精确估测森林蓄积量对于森林资源管理至关重要。以江西省林区为研究对象,运用谷歌地球引擎(Google Earth Engine)平台从Landsat 8遥感影像中提取多个植被指数、单波段及组合特征,并结合国家森林资源连续清查的地面实测数据,分析不同影像特征参数在森林蓄积量反演中的贡献率。结果表明:对比多元线性回归、神经网络、随机森林和XGBoost模型估测森林蓄积量的精度,随机森林模型估测精度为93.3%,决定系数(R^(2))为0.9337,均方根误差为2.2323,平均绝对误为2.3395;与BP神经网络模型(R^(2)=0.8219)和XGBoost模型(R^(2)=0.7916)相比,模型拟合度和预测效果更佳,比多元线性回归模型(R^(2)=0.688)处理非线性关系的稳定性和可靠性更高。通过解释特征参数的相对重要性,揭示出平均胸径、郁闭度等特征对森林蓄积量影响显著,且随机森林模型中各因子间存在相互作用。 展开更多
关键词 shap解释模型 机器学习模型 森林蓄积量
在线阅读 下载PDF
基于XGBoost-SHAP方法的陕西省PM_(2.5)影响因素分析 被引量:4
6
作者 赵兴赟 张强 +4 位作者 杨方社 郑烈龙 罗嘉昕 史治辉 问思路 《环境科学研究》 北大核心 2025年第5期990-999,共10页
陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气... 陕西省因经济快速发展及冬季化石燃料的广泛使用,面临着复杂的自然和社会因素导致的PM_(2.5)污染,探究陕西省PM_(2.5)的时空分布特征及其影响因素,对污染治理和空气质量改善具有重要意义。基于2013−2022年中国高分辨率高质量近地表空气污染物数据集,对陕西省PM_(2.5)浓度的时空变化特征进行研究,通过构建XGBoost模型并结合SHAP方法,分析陕西省PM_(2.5)浓度与气象、地形及植被因素和社会经济因素的关系,阐明各因素对PM_(2.5)浓度的时空影响。结果表明:①时间上,2013−2022年陕西省PM_(2.5)浓度整体呈现下降趋势,年均浓度最大值(56.02μg/m^(3))出现在2013年,在2019−2022年PM_(2.5)年均浓度低于《环境空气质量标准》(GB 3095−2012)二级标准限值(35μg/m^(3));空间上,陕西省呈现“关中高、陕南和陕北低”的污染空间格局。②在所研究的影响因素中,XGBoost-SHAP方法揭示了影响陕西省PM_(2.5)浓度的主要因素依次为高程、相对湿度、温度和人口密度,其中,高程和相对湿度对陕西省PM_(2.5)浓度具有负向影响,而温度和人口密度则表现为正向影响。③通过划分影响区发现,陕北、关中及陕南地区PM_(2.5)主要影响因素的作用方向与影响强度存在显著的空间异质性。研究显示,2013−2022年陕西省PM_(2.5)浓度大幅下降,PM_(2.5)的主要影响因素在不同区域存在空间差异,治理PM_(2.5)污染需要综合考虑区域异质性与多重影响因素的协同作用。 展开更多
关键词 PM_(2.5) XGBoost模型 shap方法 时空特征 影响因素
在线阅读 下载PDF
基于机器学习和SHAP算法的声波测井曲线重构及可解释性分析 被引量:7
7
作者 黎子豪 蒋恕 《地质科技通报》 北大核心 2025年第1期321-331,共11页
测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间... 测井技术是查明地下岩性、地层及地质流体的关键技术手段,在石油勘探行业中发挥着至关重要的作用。然而,由于仪器损坏、井眼条件等因素,经常造成测井数据缺失、曲线不全等问题,传统多元线性回归或经验公式方法无法合理地构建测井曲线间的关系模型使得曲线重构精度相对较低,机器学习算法虽能在大量数据之间找到最为合适的数据映射关系进而提高模型精度,但相较而言其所构建的黑箱模型无法得到良好的解释。近期,可解释性算法的运用使得机器学习在重构测井曲线中的应用更为合理。通过将支持向量回归(support vector regression,简称SVR),随机森林(random forest,简称RF)以及极限梯度提升(extreme gradient boosting,简称XGBoost)和传统多元线性回归方法(linear regression,简称LR)的对比对英国能源局22-30b-11号井声波测井曲线进行了模型重构并基于shapley additive explanations(SHAP)算法对XGBoost模型进行了解释。结果表明,XGBoost在测试集上的决定系数(R2)和均方误差(MSE)分别为0.996,6.371,优于SVR的0.990、15.755和RF的0.993、9.871,而传统多元线性回归方法则为0.969、48.895,表明XGBoost对声波时差曲线的重构具有更高的准确度和更好的泛化性能。创新性地采用SHAP算法对XGBoost黑箱模型的解释表明,在模型构建选择重要特征时,XGBoost模型采用地层温度数据作为特征明显合理于多元线性回归方法采用的井径测井数据。最后基于SHAP对模型进行了单点和全局特征交互解释。上述结果表明在声波测井曲线重构方面,机器学习算法明显优于传统的多元线性回归方法,并证明了SHAP算法在声波测井曲线重构机器学习模型解释方面的可行性,为后续机器学习在测井解释中的发展提供了新的思路。 展开更多
关键词 测井曲线重构 机器学习 模型解释 shap算法 声波测井
在线阅读 下载PDF
基于特征选择的SHAP-Transformer高炉铁水硅含量预报模型 被引量:1
8
作者 马居安 郑华伟 +4 位作者 刘栋梁 陆昊 周进东 毕学工 熊玮 《钢铁》 北大核心 2025年第8期68-78,共11页
数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal c... 数据驱动方法在高炉铁水硅含量预报方面取得了一定的成功,但由于高炉的复杂性,特征参数的强耦合、大时滞和多时间尺度特点提高了模型的训练难度,这是硅预报模型应用需要持续研究和特别关注的问题。采用时间窗口和主成分分析(principal component analysis,PCA)将22个分钟级的特征参数转化为铁次级参数,进一步采用滑动窗口和最大信息系数(maximal information coefficient,Cimax)确定了参数的滞后时长。利用随机森林优化的SHAP算法对34个参数在强耦合条件下的重要性进行评估,筛选出7个关键参数。使用SHAP算法优化Transformer的自注意力机制,构建了SHAP-Transformer铁水硅含量预报模型,通过现场数据验证了模型的有效性。结果表明,铁水硅质量分数预测误差为-0.05~0.05和-0.1~0.1时,基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型的命中率最高,分别为72.12%和95.76%,比基于MIC参数选择的SHAP-Transformer模型提高了26.67%和21.21%,比基于滑动窗口时滞分析及耦合参数优选的长短时记忆网络(long short-term memory,LSTM)模型提高了17.57%和9.7%。基于滑动窗口时滞分析及耦合参数优选的SHAP-Transformer模型对铁水硅含量的变化趋势预测也有较高的精度,趋势方向预测的准确率为87.3%,趋势类别预测的准确率为60.5%,研究能够为高炉操作者提前判断炉温变化提供可靠依据。 展开更多
关键词 高炉 铁水硅含量 特征选择 时滞分析 随机森林 shap算法 炼铁 预报模型
原文传递
良性前列腺增生并发膀胱结石的危险因素分析及基于SHAP的可解释性预测模型构建
9
作者 赵欢 欧阳松 +1 位作者 董洪超 王勤章 《现代泌尿外科杂志》 2025年第8期653-661,共9页
目的探讨良性前列腺增生(BPH)患者并发膀胱结石(BS)的独立危险因素,构建预测模型和部署便于使用的网站。方法回顾性分析2022年1月—2025年1月石河子大学第一附属医院泌尿外科收治的460例BPH患者的临床资料,通过单因素逻辑回归结合Borut... 目的探讨良性前列腺增生(BPH)患者并发膀胱结石(BS)的独立危险因素,构建预测模型和部署便于使用的网站。方法回顾性分析2022年1月—2025年1月石河子大学第一附属医院泌尿外科收治的460例BPH患者的临床资料,通过单因素逻辑回归结合Boruta算法共同识别训练集患者中BPH并发BS的独立危险因素,并基于危险因素构建列线图模型。通过受试者工作特征(ROC)曲线、灵敏度、特异度、阳性预测值(PPV)、阴性预测值(NPV)、F1指数、校准曲线和临床决策曲线(DCA)综合评价模型预测效能;使用SHAP算法评估不同变量对BPH并发BS的贡献度。并基于预测模型建立便于使用的网页。结果460例BPH患者中并发BS者144例(31.3%)。单因素逻辑回归结合Boruta算法共识别出中性粒细胞占比、尿培养结果、膀胱内前列腺突出度(IPP)、尿亚硝酸盐检测结果、尿白细胞检测结果和尿潜血结果6个独立危险因素。测试集中,该列线图的ROC曲线下面积为0.887(95%CI:0.816~0.947),灵敏度、特异度、PPV、NPV和F1指数分别为0.705、0.968、0.912、0.876和0.795,校准曲线和DCA均展示出良好的区分能力和临床应用能力。SHAP结果显示IPP、尿白细胞检测结果、尿培养结果、中性粒细胞占比、尿亚硝酸盐检测结果和尿潜血结果是BPH并发BS最重要的危险因素。最终建立可公开访问的BPH并发BS诊断的网站(https://wutiaowu2.shinyapps.io/bladderrrr/)。结论中性粒细胞占比、尿培养结果、IPP、尿亚硝酸盐检测结果、尿白细胞检测结果和尿潜血结果是BPH并发BS的独立影响因素,基于此构建的模型及网页易用且准确度高,具有较高的临床实用价值。 展开更多
关键词 前列腺增生 膀胱结石 列线图 预测模型 shap算法
暂未订购
基于RFECV-XGBoost和SHAP的火电厂电力输灰预测模型
10
作者 刘文新 徐文辉 +4 位作者 陈朝晔 顾海英 温聪 姚雨龙 曾晰 《计算机与现代化》 2025年第4期63-69,共7页
火电厂电力输灰系统输灰产量的准确预测,对于整个火电发电效率的提升具有非常重要的意义。目前火电厂气力输灰系统主要依赖人工经验进行操作,基于此,提出一种基于XGBoost(极端梯度提升)和SHAP(沙普利加法解释)框架的智能输灰预测模型。... 火电厂电力输灰系统输灰产量的准确预测,对于整个火电发电效率的提升具有非常重要的意义。目前火电厂气力输灰系统主要依赖人工经验进行操作,基于此,提出一种基于XGBoost(极端梯度提升)和SHAP(沙普利加法解释)框架的智能输灰预测模型。首先,依托火电厂电力输灰系统的DCS系统,获取空气压力、设备温度等数据信息。其次,为了提升模型预测值准确度和防止过拟合,采用RFECV(交叉验证递归特征消除法)进行特征选择,随后将选择好的特征集导入XGBoost的智能输灰预测模型中,同时采用SHAP模型进行可视化的因果分析,进而从电力输灰数据中发现有用的信息,形成火电厂电力输灰系统的知识库,以达到更加智能高效的运行目标。研究结果可对火电厂输灰预警技术,输灰系统智能化升级方面提供数据支撑,有助于火电厂电力输灰系统节能降耗。 展开更多
关键词 火电厂 输灰预测 XGBoost模型 shap
在线阅读 下载PDF
利用SHAP框架揭示道路网选取中的特征重要性 被引量:2
11
作者 褚天舒 闫浩文 +1 位作者 禄小敏 李蓬勃 《地球信息科学学报》 北大核心 2025年第5期1068-1080,共13页
[目的]城市道路网选取是地图综合领域的重要研究方向之一,其中特征选择是影响选取准确性的关键环节。然而,随着新的特征指标不断提出,如何科学地选择特征成为了一直以来亟待解决的难题。[方法]本文引入了机器学习的可解释性框架—SHaple... [目的]城市道路网选取是地图综合领域的重要研究方向之一,其中特征选择是影响选取准确性的关键环节。然而,随着新的特征指标不断提出,如何科学地选择特征成为了一直以来亟待解决的难题。[方法]本文引入了机器学习的可解释性框架—SHapley加性解释(SHapley Additive exPlanations, SHAP),旨在分析道路网选取中的特征重要性,为特征选择提供新的解决方案。首先,通过文献统计的方式,研究选用了7种常见的特征作为研究对象,并以10个中国典型城市的1:25万和1:100万比例尺道路网数据为基础,构建包含7种特征指标的数据集。随后,利用LightGBM与XGBoost两种监督学习模型进行训练,并通过模型的评价指标对模型性能进行评估。最后,采用SHAP框架对2个模型进行解释,并分析特征间的相似性、作用方向及其重要性。[结果]在特征相似性方面,拓扑特征具有较强的相似性,“周边POI数量”与其他特征的相似性较低。在特征作用方向方面,“周边POI数量”和“交通流量”对模型的影响较为不稳定,而其他特征的高值通常有正向贡献。在特征重要性方面,XGBoost模型显示“等级”是最重要的特征,之后是“长度”和“交通流量”。而LightGBM模型的结果与XGBoost模型类似,表明模型对特征重要性影响较小。研究进一步基于本文的权重结果进行道路网选取,并将结果与标准数据进行对比,实验结果显示选取结果与标准数据有较高的一致性。[结论]本文提出了一种新的解决方案,用于道路网选取中的特征重要性分析,并为特征选择和特征赋权问题提供了参考依据。 展开更多
关键词 地图综合 城市道路网选取 shap框架 特征重要性 监督学习 XGBoost模型 LightGBM模型
原文传递
基于随机森林与SHAP算法的致密砂岩气暂堵效果的影响因素分析
12
作者 黄浩 车恒达 +3 位作者 孔祥伟 辛富斌 向九洲 吉俊杰 《科学技术与工程》 北大核心 2025年第26期11135-11143,共9页
为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂... 为深入研究地质因素、分段及射孔参数、压裂施工因素对簇间暂堵效果的影响,通过构建暂堵效果量化模型和公式,收集苏里格区块暂堵井数据76组,融合随机森林和SHAP(Shapley additive explanations)值算法,建立暂堵效果算法模型。经过对暂堵效果量化模型和公式、暂堵效果算法模型验证,发现暂堵效果量化值与产气贡献率正相关,P=0.037,证明暂堵效果量化模型和公式的准确性高;又因暂堵效果算法模型中,训练集与测试集的MSE、MAE、R^(2)相差微小,证明该模型的泛化能力较强且准确性高。在暂堵效果算法模型的基础之上,开展暂堵效果的影响因素分析,结果表明:总段数、渗透率、暂堵球数量、簇间距和砂比这5个因素对于暂堵效果的影响占比最大。进一步分析单影响因素,发现随总段数增加,暂堵效果增加的规律只适用于直井,对水平井不适用;随渗透率增加,暂堵效果变差;暂堵球数量<50个、簇间距>20 m、砂比介于18%~20%,暂堵效果均可达到正向增长。研究结果可为苏里格等气田现场暂堵作业设计提供借鉴和参考。 展开更多
关键词 苏里格气田 致密砂岩气 暂堵效果 随机森林 shap(shapley additive explanations)值 模型解释
在线阅读 下载PDF
基于XGBoost-SHAP模型的儿科医院门诊患者满意度分析
13
作者 颜艳梅 《信息与电脑》 2025年第8期139-144,共6页
分析儿科医院门诊满意度数据,可为儿科门诊的精准改进提供有针对性的意见与建议。研究依托儿科医院门诊患者满意度调查数据,剖析门诊患者满意度的基本状况,构建XGBoost机器学习模型。结合SHAP(SHapley Additive exPlanations)可解释性... 分析儿科医院门诊满意度数据,可为儿科门诊的精准改进提供有针对性的意见与建议。研究依托儿科医院门诊患者满意度调查数据,剖析门诊患者满意度的基本状况,构建XGBoost机器学习模型。结合SHAP(SHapley Additive exPlanations)可解释性分析方法,系统量化了影响满意度的关键因素,并分析了其在门诊科室和门诊类别上的分布差异。结果表明,等候排队时间、就诊程序及指引、服务效率和服务态度是满意度最低的三个指标。等候排队时间在时序上呈波动趋势,寒暑假期间满意度较高。XGBoost拟合模型效果良好,R^(2)达到0.77。SHAP分析得出最重要的三个因子为环境设施卫生等后勤、医生诊疗水平、服务效率和服务态度,并探讨了这三个因子之间的交互作用。结论:需从流程、能力、监测等多方面提升满意度,对发热门诊实施“闭环服务链”以减少患者等候时间;对急诊/发热门诊医护开展“沟通–技术”能力培训,增强沟通与专业技术能力;对连续三个月满意度较低的科室进行根因分析。 展开更多
关键词 门诊满意度 机器学习 XGBoost-shap模型 儿科医院
在线阅读 下载PDF
An Interpretable Prediction Model for Stroke Based on XGBoost and SHAP
14
作者 Tianshu Fang Jiacheng Deng 《Journal of Clinical and Nursing Research》 2023年第3期96-106,共11页
Objective:To establish a stroke prediction and feature analysis model integrating XGBoost and SHAP to aid the clinical diagnosis and prevention of stroke.Methods:Based on the open data set on Kaggle,with the help of d... Objective:To establish a stroke prediction and feature analysis model integrating XGBoost and SHAP to aid the clinical diagnosis and prevention of stroke.Methods:Based on the open data set on Kaggle,with the help of data preprocessing and grid parameter optimization,an interpretable stroke risk prediction model was established by integrating XGBoost and SHAP and an explanatory analysis of risk factors was performed.Results:The XGBoost model’s accuracy,sensitivity,specificity,and area under the receiver operating characteristic(ROC)curve(AUC)were 96.71%,93.83%,99.59%,and 99.19%,respectively.Our explanatory analysis showed that age,type of residence,and history of hypertension were key factors affecting the incidence of stroke.Conclusion:Based on the data set,our analysis showed that the established model can be used to identify stroke,and our explanatory analysis based on SHAP increases the transparency of the model and facilitates medical practitioners to analyze the reliability of the model. 展开更多
关键词 Stroke risk prediction XGBoost algorithm shap model Risk factor analysis
暂未订购
基于连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演 被引量:12
15
作者 叶淼 朱琳 +3 位作者 刘旭东 黄勇 陈蓓蓓 李欢 《环境科学》 EI CAS CSCD 北大核心 2024年第4期2280-2291,共12页
针对土壤有机质含量高光谱反演中存在的光谱有效信号薄弱和光谱信息冗余问题,提出结合连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演框架.以北京市延庆区和房山区永久基本农田土壤为研究对象,首先,基于连续小波变换处理的土... 针对土壤有机质含量高光谱反演中存在的光谱有效信号薄弱和光谱信息冗余问题,提出结合连续小波变换、SHAP和XGBoost的土壤有机质含量高光谱反演框架.以北京市延庆区和房山区永久基本农田土壤为研究对象,首先,基于连续小波变换处理的土壤光谱反射率数据构建初始XGBoost模型;然后,利用SHAP方法分析模型中各波段的贡献度以筛选特征波段;最后,基于特征波段重新构建和优化XGBoost模型,实现土壤有机质含量高光谱反演.发现连续小波变换尺度为25时,利用SHAP方法选取的40个特征波段构建的XGBoost模型准确性最高,有机质含量反演值和实测值之间的R~2为0.80,RMSE为3.60g·kg^(-1);随着连续小波变换尺度的增大,R2呈现先升高后降低的趋势,25尺度下的R2比21尺度的高0.37;SHAP方法选取的特征波段比Pearson相关分析法少682个,RMSE低0.69 g·kg^(-1);XGBoost模型的R2分别比随机森林和支持向量机模型高4%和8%.验证了结合连续小波变换、SHAP和XGBoost在土壤有机质含量高光谱反演中的有效性,为快速、准确监测土壤有机质含量提供技术支撑. 展开更多
关键词 土壤有机质(SOM) 高光谱反演 连续小波变换 shap方法 XGBoost模型
原文传递
基于XGBOOST-SHAP的地铁建成环境与站点出行距离的非线性关系研究 被引量:13
16
作者 李培坤 陈旭梅 +3 位作者 鲁文博 马嘉欣 刘屹 王昊 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第4期1624-1633,共10页
相较于传统地铁客流量特征分析,地铁站点平均出行距离的研究可以更加精细化了解地铁网络客流流动性特征。为探究多重建成环境与站点平均出行距离之间的复杂关系,以西安市地铁系统为研究对象,从土地利用、兴趣点分布、周边交通建成环境... 相较于传统地铁客流量特征分析,地铁站点平均出行距离的研究可以更加精细化了解地铁网络客流流动性特征。为探究多重建成环境与站点平均出行距离之间的复杂关系,以西安市地铁系统为研究对象,从土地利用、兴趣点分布、周边交通建成环境、站点自身属性等方面构建11种建成环境指标,建立基于极端梯度提升的XGBOOST-SHAP归因分析架构的可解释性机器学习模型,以揭示两者之间的非线性关系。同时,将该模型拟合回归效果与梯度提升决策树(GBDT)及最小二乘回归(OLS)进行比较,以验证XGBOOST模型在拟合回归效果上的优势。结果表明:XGBOOST模型的R方、平均绝对误差(MAE)、均方误差(MSE)值分别为0.75、0.95、1.36,其拟合效果要优于GBDT与OLS模型。站点平均出行距离呈现出明显的环状分布的空间异质性。SHAP归因分析结果表明:距市中心距离特征贡献最大,路网密度、土地利用混合度、公交线路数量以及住宅数量对出行距离的贡献度也相对较高;POI香农熵指数、餐饮服务点对平均出行距离的正负反馈不明显;其余指标对平均出行距离的影响均呈现出正负反馈机制结合的趋势。研究结果对交通需求分析、线路容量优化、运营效果评估等提供了数据支撑,可有效提高地铁交通便利性,满足不同区域的出行需求并改善整个地铁系统的效率和可持续性。 展开更多
关键词 地铁站点 建成环境 出行距离 XGBOOST模型 shap归因分析 非线性关系
在线阅读 下载PDF
基于随机森林模型与SHAP算法的渝东北烟区土壤交换酸含量影响因素分析研究 被引量:3
17
作者 李昕容 杨超 +2 位作者 张鑫 周亚男 刘洪斌 《中国烟草学报》 CAS CSCD 北大核心 2024年第2期52-60,共9页
【背景和目的】土壤交换酸含量在农业生产中对于指导施肥和调节土壤pH具有重要作用,研究环境因子(气候、地形、成土母岩)和种植年限对土壤交换酸(Exchangeable Acidity, EA)含量的影响。【方法】以重庆市东北烟区为研究区,对该区中483... 【背景和目的】土壤交换酸含量在农业生产中对于指导施肥和调节土壤pH具有重要作用,研究环境因子(气候、地形、成土母岩)和种植年限对土壤交换酸(Exchangeable Acidity, EA)含量的影响。【方法】以重庆市东北烟区为研究区,对该区中483个采样点的土壤交换酸数据进行统计分析,构建随机森林(Random Forest, RF)模型并结合Shapley Additive exPlanations(SHAP)算法,探讨影响土壤交换酸含量的主控因素。【结果】(1)研究区土壤交换酸含量在1.56~27.50 cmol/kg之间,与降水、日照时数、坡向、种植年限呈极显著负相关性。二叠系石灰岩发育的土壤交换酸含量显著高于三叠系石灰岩发育的土壤。(2)RF模型可解释土壤交换酸含量空间变异的64%,影响因子对土壤交换酸含量的重要性为气候>成土母岩>种植年限>地形。(3)SHAP算法揭示了土壤交换酸含量在不同气候条件下存在明显的阈值效应。当年均降水量、日照时数和均温分别超过1250 mm、1290 h和12℃时,会导致土壤交换酸含量的减少,反之则会促使其增加。【结论】气候是影响土壤交换酸含量变异最重要的环境因素,其中降水和日照时数是最重要的气候因子,研究结果可为烟田土壤酸化管理调控提供参考。 展开更多
关键词 土壤交换酸 环境因子 随机森林 shap算法 阈值
在线阅读 下载PDF
基于SHAP可解释性的焊缝缺陷类型超声识别XGBoost模型 被引量:3
18
作者 陈明良 马志远 +3 位作者 张东辉 付冬欣 廖静瑜 林莉 《无损检测》 CAS 2024年第6期36-42,共7页
针对焊缝缺陷机器学习超声识别过程中存在特征冗余、可解释性差等问题,提出了一种基于SHAP可解释性的焊缝缺陷超声识别XGBoost(极限梯度提升)模型。在碳钢焊缝试样上加工4类典型缺陷,采用横波斜入射法采集超声反射回波信号,分别提取16... 针对焊缝缺陷机器学习超声识别过程中存在特征冗余、可解释性差等问题,提出了一种基于SHAP可解释性的焊缝缺陷超声识别XGBoost(极限梯度提升)模型。在碳钢焊缝试样上加工4类典型缺陷,采用横波斜入射法采集超声反射回波信号,分别提取16个时域特征、16个频域特征以及3个信息熵特征。计算SHAP值并选择其前8个高贡献特征构建特征子集,利用交叉验证和网格搜索优化XGBoost模型进行缺陷识别。试验结果表明,4种缺陷识别的平均准确率为96.7%;其中,横通孔的识别效果最佳,精确率、召回率和F_(1-score)均达到100%,三角槽次之,方形槽略差,矩形槽的识别结果最差,其精确率、召回率和F_(1-score)均为93.3%。最后,讨论了高贡献特征与缺陷类别之间的相关性,并对特征贡献差异及其原因进行了分析。 展开更多
关键词 超声检测 缺陷分类 XGBoost模型 特征选择 shap
在线阅读 下载PDF
融合随机森林与SHAP的恶意加密流量预测模型 被引量:4
19
作者 吴燕 《哈尔滨商业大学学报(自然科学版)》 CAS 2024年第2期167-178,共12页
加密流量保护用户隐私信息的同时也会隐藏恶意行为,尽早发现恶意加密流量是抵御不同网络攻击(如分布拒绝式攻击、窃听、注入攻击等)和保护网络免受入侵的关键手段.传统基于端口、深度包检测等恶意流量检测方法难以对抗代码混淆、重新包... 加密流量保护用户隐私信息的同时也会隐藏恶意行为,尽早发现恶意加密流量是抵御不同网络攻击(如分布拒绝式攻击、窃听、注入攻击等)和保护网络免受入侵的关键手段.传统基于端口、深度包检测等恶意流量检测方法难以对抗代码混淆、重新包装等复杂攻击,而基于机器学习的方法也存在误报率高和决策过程难以理解的问题.为此,提出一种恶意加密流量检测高可解释性模型EPMRS,以弥补现有研究在性能与可解释性上存在的局限性.在数据去重,重编码及特征筛选等数据预处理的基础上,基于随机森林构建恶意加密流量检测模型,并与逻辑回归、KNN、LGBM等10种主流机器学习模型进行5折交叉验证的实验对比;基于SHAP框架从整体模型、核心风险特征交互效应及样本决策过程三个不同的层面,全面增强恶意加密流量检测模型的可解释性.EPMRS在MCCCU数据集的实证结果表明,EPMRS对未知加密恶意流量的检测准确率达到99.996%、误识别率为0.0003%,与已有工作相比,性能指标平均提升了0.287175%~7.513175%;同时,通过可解释性分析识别出了session(会话)、flow_duration(流持续时间)、Goodput(有效吞吐量)等为影响恶意加密流量检测的核心风险因素. 展开更多
关键词 恶意加密流量 网络安全 随机森林 shap模型 可解释性
在线阅读 下载PDF
基于XGBoost模型和SHAP值的慢性冠脉综合征风险预测及可解释性分析
20
作者 黄希 张硕 +5 位作者 江红梅 罗斌 林佳 毛美娇 连大卫 吴黎明 《右江民族医学院学报》 2024年第6期880-885,共6页
目的构建基于XGBoost和SHAP值的可解释性模型,该模型可同时实现良好的预测能力和解释能力,可用于慢性冠脉综合征(CCS)患者的可解释预测。方法本研究选取2019年9月至2023年6月就诊于福建中医药大学附属第三人民医院、福建中医药大学附属... 目的构建基于XGBoost和SHAP值的可解释性模型,该模型可同时实现良好的预测能力和解释能力,可用于慢性冠脉综合征(CCS)患者的可解释预测。方法本研究选取2019年9月至2023年6月就诊于福建中医药大学附属第三人民医院、福建中医药大学附属南平人民医院、上海中医药大学附属龙华医院CCS患者数据,数据包括患者的临床基线资料、心血管危险因素以及既往行经皮冠状动脉介入治疗(PCI)和/或冠状动脉旁路移植术(CABG)手术情况及冠脉造影结果。在本研究中,通过将XGBoost模型与其他4种机器学习模型进行比较,评估XGBoost模型的预测性能。此外,使用基于SHAP值的可视化解释器用于提供个性化评估和解释,以实现个性化的临床决策支持。结果XGBoost模型能较好地预测CCS人群的重大不良心血管事件(MACE)发生,与以往的预测模型相比,此模型更为简单有效,预测精度高,模型召回率(RR)和受试者工作特征曲线下面积(AUC)分别为84.85%和98.01%,均高于其他4种模型结果。此外,该文对两组指标进行了特征依赖分析,发现高血压、低密度脂蛋白胆固醇(LDL-C)、吸烟指数、中医证型和年龄可显著影响MACE发生风险。结论基于XGBoost和SHAP值的可解释性模型可能有助于临床医生更准确快速地识别CCS人群中存在MACE风险的患者,为患者提供更好的治疗。此外,可视化的可解释性框架的使用增加了模型透明度,便于临床医生分析预测模型的可靠性。 展开更多
关键词 慢性冠脉综合征 XGBoost shap 预测模型 特征可视化
暂未订购
上一页 1 2 8 下一页 到第
使用帮助 返回顶部