期刊文献+
共找到66篇文章
< 1 2 4 >
每页显示 20 50 100
基于CatBoost-SHAP-MCM模型的关中地区PM_(2.5)浓度的气象影响因素研究
1
作者 苏佳 聂达文 +3 位作者 李晓萌 张新生 宋金昭 董明放 《环境科学研究》 北大核心 2025年第4期787-797,共11页
为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同... 为研究关中地区PM_(2.5)浓度变化及其复杂因素间的非线性关系,基于2020年1月−2023年12月的气象数据,从年、季和月不同时间尺度深入分析关中地区PM_(2.5)的空间分异特征;采用最大信息系数分析关中地区PM_(2.5)与其他大气污染物的关系,同时利用CatBoost-SHAP-MCM模型识别PM_(2.5)浓度的关键气象影响因素。结果表明:①关中地区PM_(2.5)浓度呈明显的空间分布和季节变异性。年际PM_(2.5)浓度在2021年最低,为42.93μg/m^(3),在2022年最高,达49.09μg/m^(3)。季度和月际变化较为相似,均呈冬季高、夏季低的特征,冬季污染最严重,PM_(2.5)浓度达84.35μg/m^(3),夏季最轻,为21.42μg/m^(3)。西安市、咸阳市和渭南市为高污染城市,铜川市和宝鸡市为低污染城市。②PM_(2.5)浓度与PM10浓度的相关性最高,与CO浓度、SO2浓度相关性均较低。③露点温度、气温、海平面气压、降水量和地面气压为关键气象影响因素,其在各城市表现出显著的影响作用,对关中地区整体和各城市的影响基本保持一致。④在低露点温度、低气温以及低露点温度、高海平面气压和高地面气压等特定因素组合下,其对PM_(2.5)浓度的影响更为显著。研究显示,关中地区PM_(2.5)浓度具有明显的空间分异特征和季节性变化特征,且与露点温度、气温、海平面气压、降水量和地面气压等气象因素密切相关,在特定气象组合条件下PM_(2.5)浓度波动更为显著。 展开更多
关键词 关中地区 PM_(2.5) 影响因素 catboost-SHAP-MCM模型
在线阅读 下载PDF
基于贝叶斯优化Catboost的转炉炼钢供氧量预测模型
2
作者 朱勇 王宇河 +1 位作者 陈建伟 杨伟弘 《宝钢技术》 2025年第3期39-46,共8页
基于转炉炼钢的实际生产数据,根据工艺经验与互信息量进行供氧量特征选择,采用贝叶斯优化(Bayesian optimization,BO)算法确定随机森林模型(random forest)、LightGBM(light gradient boosting machine)模型、Catboost(categorical boos... 基于转炉炼钢的实际生产数据,根据工艺经验与互信息量进行供氧量特征选择,采用贝叶斯优化(Bayesian optimization,BO)算法确定随机森林模型(random forest)、LightGBM(light gradient boosting machine)模型、Catboost(categorical boosting)模型的参数,预测转炉吹炼的供氧量。用30576炉的实际生产数据对模型进行训练,7644炉的数据用于验证模型的预测效果。结果表明:在预测供氧量与实绩供氧量体积差值分别为±300、±500 m^(3)的范围下,贝叶斯优化的Catboost模型的预测命中率分别为80.93%和95.02%。与随机森林模型和LightGBM模型相比较,Catboost模型有着更高的预测精度及更强的泛化能力。 展开更多
关键词 转炉炼钢 供氧量预测 贝叶斯优化 catboost模型
在线阅读 下载PDF
基于CatBoost-LSTM模型的成渝城市群近地面O_(3)浓度估算
3
作者 任明亚 张显云 +2 位作者 杨正雄 龙安成 吴雪 《环境科学》 北大核心 2025年第6期3329-3338,共10页
受臭氧源及影响因子时空差异性的影响,作为大气中重要空气污染物的臭氧(O_(3))往往呈现出空间异质性和时域相关性.为提升O_(3)的空间分辨率和估算精度,以成渝城市群为研究区,以O_(3)地面观测站点数据为响应变量,Sentinel-5P TROPOMI离... 受臭氧源及影响因子时空差异性的影响,作为大气中重要空气污染物的臭氧(O_(3))往往呈现出空间异质性和时域相关性.为提升O_(3)的空间分辨率和估算精度,以成渝城市群为研究区,以O_(3)地面观测站点数据为响应变量,Sentinel-5P TROPOMI离线数据、ERA5再分析气象资料和地形等为解释变量,协同CatBoost和LSTM构建了一种高精度的近地面臭氧浓度估算模型(CatBoost-LSTM模型).结果表明:①整体模型中,CatBoost-LSTM模型相较于文中其它模型的估算精度最高,在验证集上的决定系数(R^(2))、均方根误差(RMSE)和平均绝对误差(MAE)分别为0.965、5.81μg·m^(−3)和4.42μg·m^(−3).②由于顾及了O_(3)浓度及其影响因子季节上的差异性,基于CatBoost-LSTM的季节模型较CatBoost-LSTM整体模型在验证集上的精度均得到了不同程度的改善,其中冬季模型精度提升最为显著.③研究区近地面O_(3)月均浓度整体呈倒“V”趋势,其中在5月份出现小幅度下降趋势,8月O_(3)浓度达到最高(89.08μg·m^(−3)),12月降到最低(29.30μg·m^(−3));近地面O_(3)浓度存在明显的季节性差异,由高到低依次为夏季(84.59μg·m^(−3))、春季(72.62μg·m^(−3))、秋季(53.59μg·m^(−3))和冬季(35.23μg·m^(−3)).④空间分布上,近地面O_(3)浓度高值区主要分布在西部海拔较高、山脉密布、工业活动频繁、交通密集度高、人口密集和污染源较多的地区.由于工业活动和交通密集度较低,加之相对较少的污染源排放和较为平坦的地形等原因,东部海拔较低地区的O_(3)浓度整体较低. 展开更多
关键词 近地面O_(3) Sentinel-5P TROPOMI数据 成渝城市群 catboost-LSTM模型 时空分布
原文传递
基于SSA优化CatBoost的甘南草地土壤有机碳含量估算
4
作者 马子茗 张美玲 刘星宇 《环境科学》 北大核心 2025年第8期4961-4970,共10页
估算甘南藏族自治州草地土壤有机碳(SOC)含量并研究其空间分布特征,明确SOC主要影响因素,对草地质量提升与管理优化、气候调节和生态系统功能维持具有重要意义.以甘肃省甘南藏族自治州草地为研究对象,通过整合土壤属性、气象因子、高程... 估算甘南藏族自治州草地土壤有机碳(SOC)含量并研究其空间分布特征,明确SOC主要影响因素,对草地质量提升与管理优化、气候调节和生态系统功能维持具有重要意义.以甘肃省甘南藏族自治州草地为研究对象,通过整合土壤属性、气象因子、高程和植被指数等数据构建多特征因子数据,通过皮尔逊相关性分析筛选出24个显著特征因子,根据SHAP值得到归一化贡献程度.运用机器学习模型划分8∶2的训练集和测试集,采用十折交叉验证,实验5次得到结果并根据MAE、RMSE和R2等评估模型,采用麻雀搜索算法(SSA)和鲸鱼优化算法(WOA)优化参数并估算SOC含量.结果表明,基于模型估算的甘南藏族自治州草地表层SOC储量空间分布呈现出从西到东逐渐降低,西北高,东南低的走势,西北部的平均温度相对较低,有机碳含量较高;年平均气温、增强植被指数(EVI)和数字高程模型(DEM)对甘南草地SOC含量的贡献明显,是影响SOC空间分布的主要因素;在随机森林、决策树、梯度提升回归、CatBoost、XGBoost和LightGBM中,CatBoost模型在测试集上的表现最佳;根据SSA和WOA收敛速率曲线,发现SSA收敛更快,更新参数更有效;优化后的SSA-CatBoost模型在预测SOC含量方面表现最佳.SOC空间分布对区域内的生态系统和碳循环有着重要影响,甘南地区西北部草地在土壤肥力和碳储存方面具有更大的潜力,有助于制定更有效的土壤管理和生态保护策略,减缓气候变暖的进程,进一步推动全球生态系统的可持续发展. 展开更多
关键词 土壤有机碳(SOC) 机器学习 catboost模型 优化算法 甘南草地
原文传递
结合CatBoost算法与ARIMA模型的电池健康状态预测与优化
5
作者 马玲琦 邹海荣 李兴家 《电器与能效管理技术》 2025年第3期31-37,75,共8页
针对电池健康状况(SOH)的预测,提出一种集成分类提升(CatBoost)算法和自回归差动平均(ARIMA)模型的SOH估算方法。通过时间序列分析提取特征并获取ARIMA模型残差,将其作为额外特征经CatBoost算法处理,构建增强数据集进行预测。实验结果表... 针对电池健康状况(SOH)的预测,提出一种集成分类提升(CatBoost)算法和自回归差动平均(ARIMA)模型的SOH估算方法。通过时间序列分析提取特征并获取ARIMA模型残差,将其作为额外特征经CatBoost算法处理,构建增强数据集进行预测。实验结果表明,所提方法显著提升了预测性能,最佳均方根误差(RMSE)达到0.0046,平均绝对误差(MAE)达到0.0034,拟合度(R^(2))达到0.9994,相比仅使用初始数据的模型具有更高的准确性和稳定性。 展开更多
关键词 电池健康状态 catboost算法 ARIMA模型 残差 增强数据集
在线阅读 下载PDF
基于CatBoost的四川木里县森林火灾预测
6
作者 杨正雄 张显云 +2 位作者 任明亚 吴雪 龙安成 《科学技术与工程》 北大核心 2025年第21期8823-8832,共10页
森林火灾严重威胁着人类生命和财产安全,森林火灾风险的精确预测对于减灾防灾具有重要意义。受地形、气象、植被覆盖和人类活动等因素的影响,森林火灾诱发的原因存在区域差异性。以四川省木里县历史森林火灾事件为响应变量,以地形、气... 森林火灾严重威胁着人类生命和财产安全,森林火灾风险的精确预测对于减灾防灾具有重要意义。受地形、气象、植被覆盖和人类活动等因素的影响,森林火灾诱发的原因存在区域差异性。以四川省木里县历史森林火灾事件为响应变量,以地形、气象、植被覆盖和人类活动数据为解释变量,充分发挥CatBoost在高维稀疏数据和分类问题方面的优势,构建了一种基于CatBoost的高精度树林火灾预测模型。实验结果表明,相较于随机森林(random forest,RF)、极端梯度提升(extreme gradient boosting,XGBoost)和梯度提升决策树(gradient boosting decision trees,GBDT)模型,CatBoost模型不仅可获得更高的建模精度,而且树林火灾的预测精度也得到了显著改善,预测准确率达91.36%,曲线下的面积(area under curve,AUC)为0.970。基于所构建模型进行火灾预测,可为木里县森林火灾的早期防范提供参考依据。 展开更多
关键词 森林火灾预测模型 木里县 森林火灾 catboost 准确率
在线阅读 下载PDF
基于CatBoost的恶劣天气下电网设备故障预测模型
7
作者 江上航 王国庆 +1 位作者 朱建明 黄钧 《安全与环境工程》 北大核心 2025年第2期133-142,共10页
恶劣天气对电网设备故障的发生有着显著影响,进而威胁电网的安全运行。综合气象特征与地理信息特征,提出一种恶劣天气下基于CatBoost(分类数据提升树)算法的电网设备故障预测模型。首先收集故障信息、实时气象和地理信息等原始数据,并使... 恶劣天气对电网设备故障的发生有着显著影响,进而威胁电网的安全运行。综合气象特征与地理信息特征,提出一种恶劣天气下基于CatBoost(分类数据提升树)算法的电网设备故障预测模型。首先收集故障信息、实时气象和地理信息等原始数据,并使用MICE Forest(多重插补随机森林)算法填补缺失值;然后根据数据特征属性进行特征衍生得到时间、气象等方面的8个新特征,并利用递归特征消除方法结合交叉验证方法,评估特征的重要度,选取重要度最高的特征作为输入来构建模型;接着以最高准确率为优化目标,使用贝叶斯算法得到模型最优参数;最后在测试集上对模型准确率、精确率和调和均值F1进行验证。结果表明:提取得到的新特征有助于提高模型的预测精度,并且,与其他模型相比具有更高的预测精度,其准确率为0.831,精确率为0.858,调和均值为0.756。 展开更多
关键词 恶劣天气 catboost 特征工程 电网设备故障 预测模型
在线阅读 下载PDF
基于Catboost算法的中国典型农业区重金属污染特征及影响因素分析 被引量:3
8
作者 李珊 杨济妮 +3 位作者 苏贵金 李倩倩 孟晶 史斌 《环境化学》 CAS CSCD 北大核心 2024年第10期3377-3387,共11页
土壤是保障人类生存和发展的物质基础,农田土壤与人类生产生活密切相关,农田土壤污染问题值得关注.本文选取东北三省、京津冀和长江经济带作为研究区域,通过文献调研筛选出2000—2020年发布的400篇相关文献,收集到2052表层土壤样本,通... 土壤是保障人类生存和发展的物质基础,农田土壤与人类生产生活密切相关,农田土壤污染问题值得关注.本文选取东北三省、京津冀和长江经济带作为研究区域,通过文献调研筛选出2000—2020年发布的400篇相关文献,收集到2052表层土壤样本,通过统计学、空间分析和机器学习等方法对其污染特征进行分析.结果表明,与农用地最严格的筛选值标准相比,3个研究区域Cd污染问题较为突出,东北三省、京津冀和长江经济带的超标率分别为37.5%、34.0%和45.8%,长江经济带也存在Cu污染问题,其超标率为30.6%;进一步将采样点位分为矿区周边点位、市郊区点位和其他农田点位,采用潜在生态风险指数法评价表明,矿区周边样点严重和重风险占比(54.8%)显著高于市郊区样点(37.2%)和其他农田样点(36.6%).采用Catboost模型进行影响因子识别发现,矿区周边农田主要受选矿、尾矿暴露等造成的Cd和Hg污染影响,而市郊区农田主要受商业、工业和交通运输业等人类活动带来的Hg污染影响,其他农田土壤中主要受农药化肥的施用以及大型器械化带来的Cd污染影响. 展开更多
关键词 农田土壤 重金属 污染特征 catboost 模型 影响因素.
原文传递
基于最大李雅普诺夫指数异常感知和CatBoost识别的机械密封失效模式层次化诊断框架 被引量:5
9
作者 侯耀春 周昶清 +4 位作者 武鹏 何伟挺 赵奂芃 黄文君 吴大转 《工程热物理学报》 EI CAS CSCD 北大核心 2024年第1期93-100,共8页
离心泵在现代工业生产中具有广泛的应用,其运行状况和健康程度直接影响着整个系统的能耗、效率和安全。机械密封泄漏或损坏是水力旋转机械最典型的故障之一,与机封失效相关的泵类设备故障问题直接影响系统总体的可靠性和安全性。为此,... 离心泵在现代工业生产中具有广泛的应用,其运行状况和健康程度直接影响着整个系统的能耗、效率和安全。机械密封泄漏或损坏是水力旋转机械最典型的故障之一,与机封失效相关的泵类设备故障问题直接影响系统总体的可靠性和安全性。为此,本论文研究了一种基于最大李雅普诺夫指数异常感知和CatBoost识别的机械密封失效模式层次化诊断框架。首先,对采集的机械密封处振动信号序列提取其最大李雅普诺夫指数,并基于模糊统计法和指派法设计Type-1模糊逻辑,从而实现对机械密封故障的异常检测和感知。接着,一旦检测到机封异常,再从原始振动信号中提取多尺度模糊熵,联同最大李雅普诺夫指数一起输入到CatBoost模型进行机械密封失效模式识别和诊断。最后,基于实际实验数据对所提出的层次化诊断框架进行了验证。结果表明,所提出的方法对机封故障的异常检测精度达到100%,CatBoost模型的机封失效模式识别率达到99.66%,其精度和鲁棒性均好于支持向量机、AdaBoost、深度神经网络等智能模型。 展开更多
关键词 机械密封 异常感知 故障模式识别 最大李雅普诺夫指数 模糊理论 catboost模型
原文传递
基于Catboost模型的广东省近地面NO_(2)浓度估算 被引量:2
10
作者 张洪飞 杜宁 +3 位作者 王莉 张显云 龚德才 李隆 《环境科学》 EI CAS CSCD 北大核心 2024年第11期6276-6285,共10页
氮氧化物(NO_(x))是大气中的一类重要空气污染物,二氧化氮(NO_(2))是其主要组成部分之一,NO_(2)浓度的监测和估算对于环境保护和公共健康至关重要.使用Sentinel-5P大气污染监测卫星提供的近实时二氧化氮浓度数据(NRTI NO_(2))、ERA5气... 氮氧化物(NO_(x))是大气中的一类重要空气污染物,二氧化氮(NO_(2))是其主要组成部分之一,NO_(2)浓度的监测和估算对于环境保护和公共健康至关重要.使用Sentinel-5P大气污染监测卫星提供的近实时二氧化氮浓度数据(NRTI NO_(2))、ERA5气象再分析数据和DEM数据作为估算变量,基于Catboost模型,对广东省近地面NO_(2)浓度进行估算.结果表明:①Catboost模型估算的近地面NO_(2)浓度精度最高,其模型拟合的决定系数(R^(2))、均方根误差(RMSE)和平均绝对误差(MAE)分别达到0.91、4.89μg·m^(-3)和3.45μg·m^(-3),交叉验证R^(2)、RMSE和MAE分别达到0.90、4.91μg·m^(-3)和3.43μg·m^(-3),同时在月尺度和季尺度也具有良好的稳定性.②广东省近地面NO_(2)月均浓度总体上呈先降后升的“U”型趋势,1月的NO_(2)浓度最高,最高值为43.8μg·m^(-3),7月达到最低点,最低值为14.37μg·m^(-3).近地面NO_(2)季均浓度存在“冬高夏低,春秋过渡”的季节分布特征,各季节NO_(2)浓度大小依次为:冬季(27.53μg·m^(-3))>春季(20.77μg·m^(-3))>秋季(18.77μg·m^(-3))>夏季(14.85μg·m^(-3)).③从空间分布角度看,广东省近地面NO_(2)高值地区主要位于发展迅速且人口密集的地区,而低值地区主要分布在注重港口经济、农业和新能源等领域的地区. 展开更多
关键词 近地面NO_(2) Sentinel-5P 近实时二氧化氮 catboost模型 时空分布
原文传递
基于CatBoost-SHAP模型的滑坡易发性建模及可解释性 被引量:7
11
作者 曾韬睿 王林峰 +2 位作者 张俞 程平 吴帆 《中国地质灾害与防治学报》 CSCD 2024年第1期37-50,共14页
文章致力于深入探索滑坡易发性建模中集成学习模型的不确定性和可解释性。以浙江省东部沿海山区为研究对象,利用谷歌历史影像与Sentinel-2A影像,记录了2016年超级台风“鲇鱼”触发的552起浅层滑坡事件。研究首先对连续型因子进行了不分... 文章致力于深入探索滑坡易发性建模中集成学习模型的不确定性和可解释性。以浙江省东部沿海山区为研究对象,利用谷歌历史影像与Sentinel-2A影像,记录了2016年超级台风“鲇鱼”触发的552起浅层滑坡事件。研究首先对连续型因子进行了不分级、等间距法和自然断点法的工况设计,进一步划分为4,6,8,12,16,20级。随后,引入了类别增强提升树模型(CatBoost)以评估不同工况下的滑坡易发性值,再结合受试者曲线与沙普利加性解释法分析,对建模过程中的不确定性和可解释性进行了深入研究,目的在于确定最优建模策略。结果表明:(1)在CatBoost模型计算中,河流距离成为最关键的影响因子,其次是与地质条件、人类活动相关的因子;(2)不分级工况下,模型能够获得最高的AUC值,达到0.866;(3)相较于等间距法,自然断点法的划分策略展现出更佳的泛化能力,且模型预测性能随着分级数量的增加而增加;(4)沙普利加性解释法模型揭示了主要影响因子道路距离、河流距离、DEM和坡向对台风诱发滑坡的控制机制。研究成果能够加深对滑坡易发性的理解,提高滑坡预测的准确性和可靠性,为相关地区的防灾减灾工作提供科学依据。 展开更多
关键词 滑坡 易发性建模 可解释性 catboost模型 沙普利加性解释法模型 台风诱发滑坡
在线阅读 下载PDF
基于网格搜索优化CatBoost模型的GF-5卫星影像铬离子含量反演研究 被引量:3
12
作者 刘东宜 屈永华 +1 位作者 冯耀伟 屈冉 《生态环境学报》 CSCD 北大核心 2024年第9期1460-1470,共11页
高光谱遥感技术以其低成本、高效率、广泛覆盖范围、宏观性强和动态监测能力等优势而受到关注。利用高光谱遥感技术,对安图县新合乡尾矿库土壤中六价铬离子污染状况进行有效监测;以高分五号(GF-5)卫星的高光谱遥感影像及实测土壤样本为... 高光谱遥感技术以其低成本、高效率、广泛覆盖范围、宏观性强和动态监测能力等优势而受到关注。利用高光谱遥感技术,对安图县新合乡尾矿库土壤中六价铬离子污染状况进行有效监测;以高分五号(GF-5)卫星的高光谱遥感影像及实测土壤样本为数据源,基于皮尔逊相关系数、波段加法和比值指数,提取与土壤重金属含量变化相关的特征,构建反演模型。首先,剔除预处理后的遥感影像中饱和、噪声和水汽吸收波段,同时利用各波段反射率进行代数运算构建加法和比值指数,计算其与实测铬离子含量数据的皮尔逊相关系数;然后,基于皮尔逊相关系数得到的前50最高相关特征变量,采用网格搜索优化的CatBoost回归,建立土壤六价铬离子含量反演模型,并使用SHAP方法评估特征重要性,探究影响GF-5反演土壤重金属重要波段。结果显示,在相同光谱变换条件下,与偏最小二乘回归(PLSR)、随机森林回归(RFR)、支持向量机回归(SVMR)、卷积神经网络(CNN)和多元逐步线性回归模型相比,网格搜索优化的CatBoost模型效果最好,训练集拟合优度为0.92,验证集为0.88。利用网格搜索优化CatBoost回归模型对吉林省安图铬渣填埋场进行了土壤六价铬离子含量反演,结果显示该区域尾矿库开采区域周边六价铬离子污染严重,这与该地矿山开采和尾矿堆放实际情况基本一致。该研究为土壤重金属污染监测和环境管理提供了重要的技术手段和科学依据。 展开更多
关键词 高光谱反演 高光谱遥感 GF-5 六价铬离子 土壤重金属 catboost回归模型
在线阅读 下载PDF
基于KMV-CatBoost增强的企业信用债券违约风险评估模型 被引量:1
13
作者 王培培 周小平 +1 位作者 陈佳佳 王涵棋 《上海师范大学学报(自然科学版中英文)》 2024年第2期247-253,共7页
针对传统预测模型对于企业信用债券违约预测准确率低、拟合效果差的问题,提出了基于Kaufman-Merton-Voss(KMV)-Categorical Boosting(CatBoost)的企业债券违约预测模型.首先对原始样本数据进行预处理,降低噪声数据对预测模型的影响;然后... 针对传统预测模型对于企业信用债券违约预测准确率低、拟合效果差的问题,提出了基于Kaufman-Merton-Voss(KMV)-Categorical Boosting(CatBoost)的企业债券违约预测模型.首先对原始样本数据进行预处理,降低噪声数据对预测模型的影响;然后,利用KMV模型评估借款公司信用违约概率,计算公司资产市场价值与公司资产市场价值的波动率,获得企业资产价值与违约点之间的差额Distance-to-Default(DD);最后,利用债务偿还期限、短期无风险收益率、公司股权市场价值、公司债务面值计算出的违约距离,将其加入指标中,利用CatBoost算法预测企业信用债券违约风险,通过基于Ordered Boosting方式的CatBoost算法训练模型,得到无偏梯度估计,以减缓预测偏移,从而增强模型的泛化能力.实验结果表明:基于KMV-CatBoost增强的模型能够提高企业信用债券违约风险识别的准确率,识别正确率约为95.5%. 展开更多
关键词 债券违约 预测模型 catboost Kaufman-Merton-Voss(KMV)
在线阅读 下载PDF
基于IGWO-CatBoost模型的岩石爆破块度预测 被引量:4
14
作者 宋家威 郇宝乾 +3 位作者 秦涛 张宇庭 王雪松 徐振洋 《爆破器材》 CAS CSCD 北大核心 2024年第2期56-64,共9页
针对无法准确预测矿山岩石爆破后块度大小的问题,提出一种基于改进灰狼算法(IGWO)优化的CatBoost块度预测模型。采用一种新的非线性收敛因子,引入动态权重策略,改进已有的灰狼算法(GWO),通过4个测试函数和5种优化算法验证了IGWO的寻优... 针对无法准确预测矿山岩石爆破后块度大小的问题,提出一种基于改进灰狼算法(IGWO)优化的CatBoost块度预测模型。采用一种新的非线性收敛因子,引入动态权重策略,改进已有的灰狼算法(GWO),通过4个测试函数和5种优化算法验证了IGWO的寻优能力。对公开数据库和现场采集的32组数据进行预测分析。首先,采用随机森林算法进行特征重要性筛选,利用IGWO对CatBoost进行参数寻优,建立IGWO-CatBoost爆破块度预测模型;然后,将预测结果与在相同条件下建立的CatBoost、XGBoost、LightGBM模型进行对比分析。经过IGWO调参,CatBoost模型的预测准确度得到有效提高,IGWO-CatBoost模型的预测准确度均优于其他3种预测模型。对比结果表明,IGWO-CatBoost模型具有很好的预测能力和适应性。 展开更多
关键词 改进灰狼算法 IGWO-catboost模型 随机森林 块度预测
在线阅读 下载PDF
基于演化CatBoost算法的房价预测模型 被引量:1
15
作者 王成章 白晓明 +1 位作者 汤文英 陈书涵 《计算机科学》 CSCD 北大核心 2024年第S02期970-974,共5页
遗传规划算法采用函数变换将原有变量张成的空间映射到新的特征空间,通过遗传算子操作实现目标函数的最优化。影响房价波动的因素有很多,各影响因素与房价之间呈现复杂的非线性关系。文中提出了一种基于演化CatBoost算法的房价预测模型... 遗传规划算法采用函数变换将原有变量张成的空间映射到新的特征空间,通过遗传算子操作实现目标函数的最优化。影响房价波动的因素有很多,各影响因素与房价之间呈现复杂的非线性关系。文中提出了一种基于演化CatBoost算法的房价预测模型,将影响房价波动的各因素变量编码为遗传规划算法的终端变量,采用CatBoost算法作为基学习器构建适应度函数,针对房价预测的特点设计合理的遗传算子,在函数映射后的特征空间上实现目标函数的最优化,以提升预测模型的性能。实验结果表明,基于演化CatBoost算法的房价预测模型的预测性能优于传统的基于随机森林算法、支持向量机算法、自适应增强算法、极致梯度提升算法等的预测模型,能够更好地实现房价的预测,在相同条件下具有更高的预测准确度。 展开更多
关键词 遗传规划 catboost算法 预测模型 决策树 最优化
在线阅读 下载PDF
基于CatBoost的空铁联运中转城市推荐研究
16
作者 白广栋 朱建军 +2 位作者 翁湦元 张鹏 刘仁全 《铁路计算机应用》 2024年第6期15-19,共5页
随着交通网络的快速发展,越来越多的旅客选择空铁联运出行,对空铁联运中转城市推荐方法提出了更高的要求。文章设计了符合空铁联运中转城市数据特点的数据不平衡处理方法,采用能够处理类别型特征的CatBoost算法构造基准模型,在2个不同... 随着交通网络的快速发展,越来越多的旅客选择空铁联运出行,对空铁联运中转城市推荐方法提出了更高的要求。文章设计了符合空铁联运中转城市数据特点的数据不平衡处理方法,采用能够处理类别型特征的CatBoost算法构造基准模型,在2个不同数据分布的测试集上对该模型进行评估,模型准确率均超过85%。通过与其他算法的对比分析,证明了该模型具有较好的稳定性和更优的性能,提高了空铁联运中转城市的推荐效果,可更好地满足旅客的出行需求;通过对特征贡献度的分析发现,下单人的姓名特征会对模型预测带来影响,从而进一步提高空铁联运中转城市的个性化推荐效果。 展开更多
关键词 空铁联运 中转城市推荐 机器学习 catboost模型 数据不平衡
在线阅读 下载PDF
基于SMOTE-CatBoost的国省道机动车死亡交通事故特征研究
17
作者 王誉翔 马社强 +1 位作者 赵丹 王晟由 《交通工程》 2024年第12期40-46,共7页
为降低国省道机动车交通事故严重程度,提取出国省道机动车死亡交通事故的显著特征,提出1种基于SMOTE-CatBoost模型的交通事故显著特征研究方法,对2016—2020年N市国省道机动车交通事故特征进行研究。首先,根据基础数据集的不平衡分布情... 为降低国省道机动车交通事故严重程度,提取出国省道机动车死亡交通事故的显著特征,提出1种基于SMOTE-CatBoost模型的交通事故显著特征研究方法,对2016—2020年N市国省道机动车交通事故特征进行研究。首先,根据基础数据集的不平衡分布情况采用SMOTE平衡算法形成平衡数据集以训练机器学习模型;其次,选用CatBoost模型构建国省道机动车交通事故预测模型;最后,采用SHAP可解释性算法挖掘国省道机动车死亡交通事故各个特征与事故的关联程度。结果表明:CatBoost模型的综合性能优于其余4种机器学习模型,其准确率、召回率、F1分数、AUC值分别比排名第2模型高8.5%、7.45%、7.09%、7.47%;死亡交通事故中显著特征有驾驶人在驾车时有其他妨碍安全驾驶行为、机动车与行人的碰撞等6种。本研究成果可为公安工作以及道路交通管理部门人员提供国省道道路死亡交通事故的显著特征,为减少死亡交通事故发生以及改善国省道道路行车环境提供一定的理论支撑。 展开更多
关键词 交通管理工程 国省道道路 机器学习 catboost模型 SHAP可解释性算法 交通安全
在线阅读 下载PDF
厄尔尼诺和南方涛动事件对浙江近海杜氏枪乌贼潜在栖息地分布的影响
18
作者 陈峰 李建雄 +3 位作者 方光杰 张洪亮 蒋日进 徐开达 《生态学报》 北大核心 2025年第20期10153-10163,共11页
气候变化能够引起海洋环境的变化,影响海洋生物的生命活动,作为一种短周期生活史的头足类生物,杜氏枪乌贼的潜在栖息地分布对气候变化的响应较为强烈。为探索气候变化对浙江近海杜氏枪乌贼潜在栖息地的影响,研究根据2018—2023年4—5月... 气候变化能够引起海洋环境的变化,影响海洋生物的生命活动,作为一种短周期生活史的头足类生物,杜氏枪乌贼的潜在栖息地分布对气候变化的响应较为强烈。为探索气候变化对浙江近海杜氏枪乌贼潜在栖息地的影响,研究根据2018—2023年4—5月和11月浙江近海产卵场拖网调查资料,以及包括海表面温度、海表面盐度、溶解氧浓度等海洋环境数据,采用物种分布模型和Catboost算法模拟和分析不同厄尔尼诺和南方涛动(El Niño-Southern Oscillation,ENSO)事件下杜氏枪乌贼的栖息地分布及变动。结果显示:Catboost相较于其他机器学习模型具有更精确的预测性能,其随机预测的平均曲线下面积值(Area under curve,AUC)春季为0.757,秋季为0.896,而2023年Catboost的实际预测AUC春季为0.839,秋季为0.884。深度和海表面温度是影响杜氏枪乌贼潜在栖息地分布的主要环境因子,最适深度为40—60 m,春季海表面温度最适范围为15—18℃,秋季为18—22℃。杜氏枪乌贼的栖息地对ENSO事件具有明显的季节性响应。春季,厄尔尼诺和拉尼娜的发生都会使杜氏枪乌贼的适宜栖息地扩散。秋季杜氏枪乌贼栖息地对ENSO事件的响应更复杂,秋季拉尼娜发生期间,杜氏枪乌贼的高适生区面积大幅度扩散,且栖息海域更深;秋季厄尔尼诺发生期间,杜氏枪乌贼高适生区向外海移动,但栖息地适生区面积减少。研究可为气候变化下的浙江近海枪乌贼资源的渔业管理和开发提供科学依据。 展开更多
关键词 杜氏枪乌贼 物种分布模型 catboost 厄尔尼诺和南方涛动事件 浙江近海
在线阅读 下载PDF
Efficient soil moisture estimation on the Qinghai-Xizang Plateau via machine learning and optimized feature selection
19
作者 JIA Shichao SUN Wen +1 位作者 WEI Sihao SUN Rui 《Journal of Arid Land》 2025年第8期1147-1167,共21页
Soil moisture is a key parameter in the exchange of energy and water between the land surface and the atmosphere.This parameter plays an important role in the dynamics of permafrost on the Qinghai-Xizang Plateau,China... Soil moisture is a key parameter in the exchange of energy and water between the land surface and the atmosphere.This parameter plays an important role in the dynamics of permafrost on the Qinghai-Xizang Plateau,China,as well as in the related ecological and hydrological processes.However,the region's complex terrain and extreme climatic conditions result in low-accuracy soil moisture estimations using traditional remote sensing techniques.Thus,this study considered parameters of the backscatter coefficient of Sentinel-1A ground range detected(GRD)data,the polarization decomposition parameters of Sentinel-1A single-look complex(SLC)data,the normalized difference vegetation index(NDVI)based on Sentinel-2B data,and the topographic factors based on digital elevation model(DEM)data.By combining these parameters with a machine learning model,we established a feature selection rule.A cumulative importance threshold was derived for feature variables,and those variables that failed to meet the threshold were eliminated based on variations in the coefficient of determination(R^(2))and the unbiased root mean square error(ubRMSE).The eight most influential variables were selected and combined with the CatBoost model for soil moisture inversion,and the SHapley Additive exPlanations(SHAP)method was used to analyze the importance of these variables.The results demonstrated that the optimized model significantly improved the accuracy of soil moisture inversion.Compared to the unfiltered model,the optimal feature combination led to a 0.09 increase in R^(2)and a 0.7%reduction in ubRMSE.Ultimately,the optimized model achieved a R²of 0.87 and an ubRMSE of 5.6%.Analysis revealed that soil particle size had significant impact on soil water retention capacity.The impact of vegetation on the estimated soil moisture on the Qinghai-Xizang Plateau was considerable,demonstrating a significant positive correlation.Moreover,the microtopographical features of hummocks interfered with soil moisture estimation,indicating that such terrain effects warrant increased attention in future studies within the permafrost regions.The developed method not only enhances the accuracy of soil moisture retrieval in the complex terrain of the Qinghai-Xizang Plateau,but also exhibits high computational efficiency(with a relative time reduction of 18.5%),striking an excellent balance between accuracy and efficiency.This approach provides a robust framework for efficient soil moisture monitoring in remote areas with limited ground data,offering critical insights for ecological conservation,water resource management,and climate change adaptation on the Qinghai-Xizang Plateau. 展开更多
关键词 soil moisture machine learning feature selection radar and optical remote sensing polarization decomposition catboost model Qinghai-Xizang Plateau
在线阅读 下载PDF
基于集成学习CatBoost优化模型的爆堆大块率预测 被引量:8
20
作者 金长宇 于佳强 +1 位作者 王强 陈立军 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第12期1743-1750,共8页
爆破产生的爆堆大块率问题一直以来都影响着矿山的生产效益.利用机器学习机制中集成学习思想实现大块率预测.以满洲里乌山铜矿实际采集的36组实测数据为例,整理形成10种特征数据.通过给定参数循环训练调优,再用交叉验证网格搜索的方法... 爆破产生的爆堆大块率问题一直以来都影响着矿山的生产效益.利用机器学习机制中集成学习思想实现大块率预测.以满洲里乌山铜矿实际采集的36组实测数据为例,整理形成10种特征数据.通过给定参数循环训练调优,再用交叉验证网格搜索的方法进行模型二次调优,并对比调优实现后模型与随机森林法、XGBoost模型、LightGBM模型和CatBoost模型进行效果对比.结果表明,经过两轮调优后的CatBoost模型预测效果明显高于其他几种模型,R~2准确度可达98.83%,证明了两轮调优后CatBoost模型具有较高的预测水平,验证了该方法在大块率预测研究中的可行性,为爆破参数设计和大块率优化分析提供了可靠的参考. 展开更多
关键词 大块率预测 机器学习 集成学习 爆破 catboost模型
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部