第18届研究生数学建模竞赛B题——空气质量预报二次建模(6)

当前,空气质量对人类生存环境、人体健康的危害衍生为不可回避的话题。开展空气
质量监测、预测、数据分析及可视化的研究可以全面把控城市空气污染源的排放数据及不
同空间区域内的浓度数据,掌握空气质量在时间和空间维的变化发展趋势,对城市规划与
建设、污染控制、环境管理、公共事业发展等意义重大。基于此,本文为进一一步优化依据
大气污染防治体制机制建立的WRF-CMAQ预报模型,引入空 气质量监测点获得的实际
气象条件和污染物浓度实测数据进行空气质量预报模型修正。

本文首先对各监测点空气质量预报数据进行数据初处理,避免因数据缺失、异常、重
复或出现野值等造成研究误差。具体流程: ①考虑到污染物数据及气象数据具有较强的时
序性,因此本文运用均值法进行插值补全。特别处理l补全监测点逐小时污染物浓度与气
象数据中的缺失值,用均值插补和趋劳外推结合进行预测:依据监测点A与邻近监测点
A1、A2和A3的相对地理l位堰I,对附件3中“监测点Al逐小时污染物浓度与气象实测数
据”中缺失的“气压(MBar)”指标进行全列补充:针对附件3中“监测点A3逐小时污染
物浓度与气象实测数据”2020/12/31 23:00- 2021/4/23 15:00 的五个气象指标(温度、湿度、
气压、近地风速、风向)大段连续缺失值,依据气象指标和相对地理位置的关系,使用临
近点Al和A2的气象指标进行填补。②根据拉依达准则(3σ准则)去除非操作变量异常
值:③采用最值归- -化算法保证数据在同- -尺度下。
针对问题一:本文依据《环境空气质量指数(AQI)技术规定(试行)》(HJ633-2012)
的方法,计算得到监测点A从2020年8月25日到8月28日每天实测的AQI和首要污染
物结果如下: 8月25日AQI=60,首要污染物为臭氧O3: 8月26日AQI=46,首要污染物
无: 8月27日AQI=109,首要污染物为臭氧O3: 8月28日AQI=138,首要污染物为臭氧
)g.

针对问题二:要求在污染排放清单不变的情况下,利用气象条件对大气污染物浓度的
影响程度,对气象条件进行分类。为此,基于监测点实测数据和一-次模型预报数据,寻求
气象因子及污染物浓度的变化规律,提出厢|期彻环概念。在此基础上利用Pearson 相关系
数探究两者之间的相关性。进-一步地, 在科学对比K-means. AP. GMM、凝聚层次聚类
后,选取K-means进行无监督聚类,将气象条件聚成8类。为进一步优化分类, 选用泛化
性强、对噪声不敏感的随机森林分类算法将类别调整为6类,删除两个错误率较高的类别。
同时为提高二次预测模型的准确度及增强类别的可解释性,选用熵权法对气象因子的重要
程度进行排序,最终將气象条件分为6类进行特征总结。

针对问题三:要求建立-一个适用于多个点的二次预报模型,预测未来三天的6种常规
污染物浓度值。为此,基于前述处理数据集,综合考虑- -次模型 预测数据、监测站实际监
测气象数据、污染物浓度及奥氧污染物的生成机理,结合问题二的分类结果及信惠均益
特征鲋选结果,筛选出特征显著的变量,包括时序因子、气候因子和历史教据因子。将上
述因子作为输入变量,选用RMSE. MAE和I0A作为评价指标,对比原始CMAQ一次预
报模型、SVR 预测模型、Elman预测模型和DBN-BP预测模型的预报效果,最终建立基于
Elman神经网络的优化算法进行空气质量二次优化,预测监测点A. B、C在2021年7
月13日至7月15日6种常规污染物的单日浓度值,并依据问题- -的计 算方法得到污染物
浓度及AQI预测结果表。

针对问题四:要求建立邻近区的协同预报型,因为相邻区城间污染物浓度具有-
定关联性。首先基于BMA法确定各邻近区城监测点的数据的权重,其中利用EM算法确
定模型的参数。然后,分别对各个气象因子进行气象协同预报,对协同预报成员的结果加
权处理。最后,在此数据基础上,加入风速和风向两个参数,利用wiener对预报值进行修
正。选用RMSE. MAE和IOA三个评价指标进行效果评价,结果表明邻近区域协同模型
的预测效果优于问题三的空气质量二次预测模型,也就是说邻近区域协同模型能提升针对
监测点A的污染物浓度预报值.

最后对本文的模型进行了评价与推广,可以不断优化模型,提升空气质量预报模型预测精度.

关键词:空气质量二次预报:信息增益特征筛选: Elman 神经网络: Wiener 模型:
区域协同预报

链接:https://pan.baidu.com/s/1oL1r1wrhyGi2Lp4SttV47w?pwd=3ahh
提取码:3ahh

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注