基于机器学习的成都市县域PM2.5污染预报模型构建
钟念赤1,刘琰琰1,2,康平1,2,胡睿琪1,王安怡3,修蒙1,2,KlausSchaefer1,2,钟林芸1
2.成都平原城市气象与环境四川省野外科学观测研究站,四川成都610225
3.浙江省嘉兴市海盐县气象局,浙江嘉兴314300
摘要:在创新、协调、绿色、开放、共享的新发展理念下,为探索完善PM2.5污染预报预警、应急预案以及县域精细化管控等领域的理论体系与应用视角,基于SHAP(SHapleyAdditiveexPlanations)和随机森林(RF)构建SHAP-RF预报模型,通过分析成都市2018-2021年国控/省控监测站点数据,结合欧洲中期天气预报中心细网格模式预报资料,实现对PM2.5特征因子重要性动态识别与筛选,生成县域本地化特征因子集,并开展未来1~10dPM2.5浓度预报研究。结果表明:(1)识别出成都市影响PM2.5浓度变化的关键特征因子以起报天CO浓度、起报天NO2浓度、起报天PM2.5浓度、气温、位势高度等变量为主。(2)所构建的SHAP-RF预报模型对未来1~10d的PM2.5逐日浓度预报准确性较好,预报未来1dPM2.5浓度的均方根误差(RMSE)为9.25~17.93μg/m3,拟合优度(R2)为0.67~0.84;预报未来1~3d时,RMSE为10.60~20.45μg/m3,R2为0.57~0.74;预报未来4~10d时,RMSE为12.50~23.48μg/m3,R2为0.42~0.69。(3)单站点长时间序列PM2.5浓度逐日预报检验显示,模型能较好地捕捉到PM2.5浓度秋冬高、春夏低的季节性波动特征和逐日变化特征。(4)PM2.5污染超标预报检验显示,模型对于各站点污染超标预报准确率为89.59%~97.26%,且随着预报时效的增加,对于单站点污染超标预报准确率并没有明显减小。研究显示,SHAP值在预报模型中不仅能实现对模型可解释性的可视化呈现,同时可实现特征识别,显示特征因子重要性分布特征,SHAP-RF预报模型在实际应用中能较好地实现对未来1~10dPM2.5污染过程的预报预警。
向上滑动阅览全文












