在创新、协调、绿色、开放、共享的新发展理念下,为探索完善PM_(2.5)污染预报预警、应急预案以及县域精细化管控等领域的理论体系与应用视角,基于SHAP(SHapley Additive exPlanations)和随机森林(RF)构建SHAP-RF预报模型,通过分析成都市...在创新、协调、绿色、开放、共享的新发展理念下,为探索完善PM_(2.5)污染预报预警、应急预案以及县域精细化管控等领域的理论体系与应用视角,基于SHAP(SHapley Additive exPlanations)和随机森林(RF)构建SHAP-RF预报模型,通过分析成都市2018−2021年国控/省控监测站点数据,结合欧洲中期天气预报中心细网格模式预报资料,实现对PM_(2.5)特征因子重要性动态识别与筛选,生成县域本地化特征因子集,并开展未来1~10 d PM_(2.5)浓度预报研究。结果表明:①识别出成都市影响PM_(2.5)浓度变化的关键特征因子以起报天CO浓度、起报天NO_(2)浓度、起报天PM_(2.5)浓度、气温、位势高度等变量为主。②所构建的SHAP-RF预报模型对未来1~10 d的PM_(2.5)逐日浓度预报准确性较好,预报未来1 d PM_(2.5)浓度的均方根误差(RMSE)为9.25~17.93μg/m^(3),拟合优度(R^(2))为0.67~0.84;预报未来1~3 d时,RMSE为10.60~20.45μg/m^(3),R^(2)为0.57~0.74;预报未来4~10 d时,RMSE为12.50~23.48μg/m^(3),R^(2)为0.42~0.69。③单站点长时间序列PM_(2.5)浓度逐日预报检验显示,模型能较好地捕捉到PM_(2.5)浓度秋冬高、春夏低的季节性波动特征和逐日变化特征。④PM_(2.5)污染超标预报检验显示,模型对于各站点污染超标预报准确率为89.59%~97.26%,且随着预报时效的增加,对于单站点污染超标预报准确率并没有明显减小。研究显示,SHAP值在预报模型中不仅能实现对模型可解释性的可视化呈现,同时可实现特征识别,显示特征因子重要性分布特征,SHAP-RF预报模型在实际应用中能较好地实现对未来1~10 d PM_(2.5)污染过程的预报预警。展开更多
文摘在创新、协调、绿色、开放、共享的新发展理念下,为探索完善PM_(2.5)污染预报预警、应急预案以及县域精细化管控等领域的理论体系与应用视角,基于SHAP(SHapley Additive exPlanations)和随机森林(RF)构建SHAP-RF预报模型,通过分析成都市2018−2021年国控/省控监测站点数据,结合欧洲中期天气预报中心细网格模式预报资料,实现对PM_(2.5)特征因子重要性动态识别与筛选,生成县域本地化特征因子集,并开展未来1~10 d PM_(2.5)浓度预报研究。结果表明:①识别出成都市影响PM_(2.5)浓度变化的关键特征因子以起报天CO浓度、起报天NO_(2)浓度、起报天PM_(2.5)浓度、气温、位势高度等变量为主。②所构建的SHAP-RF预报模型对未来1~10 d的PM_(2.5)逐日浓度预报准确性较好,预报未来1 d PM_(2.5)浓度的均方根误差(RMSE)为9.25~17.93μg/m^(3),拟合优度(R^(2))为0.67~0.84;预报未来1~3 d时,RMSE为10.60~20.45μg/m^(3),R^(2)为0.57~0.74;预报未来4~10 d时,RMSE为12.50~23.48μg/m^(3),R^(2)为0.42~0.69。③单站点长时间序列PM_(2.5)浓度逐日预报检验显示,模型能较好地捕捉到PM_(2.5)浓度秋冬高、春夏低的季节性波动特征和逐日变化特征。④PM_(2.5)污染超标预报检验显示,模型对于各站点污染超标预报准确率为89.59%~97.26%,且随着预报时效的增加,对于单站点污染超标预报准确率并没有明显减小。研究显示,SHAP值在预报模型中不仅能实现对模型可解释性的可视化呈现,同时可实现特征识别,显示特征因子重要性分布特征,SHAP-RF预报模型在实际应用中能较好地实现对未来1~10 d PM_(2.5)污染过程的预报预警。