第18届研究生数学建模竞赛B题——空气质量预报二次建模(7)

本文旨在通过对WRF-CMAQ模型的一-次预报数据和监测点的实测数据进行二次建模,得到较为精准的二次建模模型。在构建二次预测模型过程中,首先进行了AQI的计算和对气象条件与各污染气体的相关关系,其次进行了两种二次建模方式的尝试,一 是通过对多个远距离监测点的一-次预报数据和实测数据进行二次建模:二是通过对近距离(天气具有相关性)多个监测点的一次预报数据和实测数据进行二次建模。最后比较两种方法的优劣性。

针对问题一,在所有公式都已经给定的情况下,计算得到了监测点A从2020年8月25日至8月28日每天实测的AQI和首要污染物。计算发现,首要污染物都是O3.

针对问题二,首先对给出的数据进行预处理,在处理过程中发现,实测数据中存在较多数据空缺和时间的空缺,此外还有异常值的处理,主要是存在气体浓度为负数和某–时刻数据过大的情况。对数据预处理后,通过对数据进行分析,发现单-气象条件和单- -污染气体浓度没有较强的相关性,随后通过多元线性回归对数据进行拟合,通过F检验和P值检验,验证了模型的正确性,并将多元线性回归后得到的各变量的显著性参数作为新的变量,进行系统聚类。研究发现了各气象条件的变化对某- -污 染气体浓度下降起促进还是抑制作用,并将气象条件分为了两类,一类为风速, 其对六种污染气体都有显著作用:其他气象条件(温度、湿度、气压和风向)为另- -类,此类气象条件与风速相比,影响较不明显。

针对问题三,对数据进行预处理后,本文对监测点A、B、C污染气体的一-次预报模型和实测模型数据进行比对,分析发现,难以直接使用单个污染气体的–次预报数据和实测数据进行二次建模。由于监测点A、B、C距离很远,可以直接将三个监测点的数据放到同一样本集中进行分析,根据三个监测点的数据,提出了向后逐步回归模型和BP神经网络模型两种二次建模方法,使用2020年7月23至2021年7月2日数据作为训练集进行拟合,并对监测点A、B、C的2021年7月8日至10日的数据作为验证集。对比发现,BP神经网络的回归值R和预测效果都明显优于多元线性回归,监测点A的AQI二次预测平均正确率为83.88%,因此,本文使用BP神经网络对2021年7月13日的预报结果进行二次建模,并计算出了各污染气体浓度预测结果和AQI值。

针对问题四,与问题三相比,由于四个检测点距离较近,因此需要考虑临近点污染气体和监测点污染气体的相关性,不能简单地将监测点A、AI、A2、A3放到同一样本集中进行预测,因此本文使用–种地质学中较为经典的Kriging方法来讨论四个监测点污染物浓度的相关性。在使用Kriging方法对某- – 监测点进行插值预测后,将插值预测值与- -次预报值进行灰色关联度分析,求解污染气体插值预测数据和一次预报数据对污染气体实测数据的权重。计算发现,插值预测值和一次预报值的权重基本相同,在0.6-0.81之间。研究证明,区域协同预报可以提升空气质量预报的准确度。最后,将插值预测结果与- -次预报结果数据通过权重相加,使用BP神经网络进行二次建模,并以2021年7月7日至10日作为验证集验证,结果表明该模型预测效果好,平均正确率为88.05%。通过该二次预测模型计算出了2021年7月13日各污染气体浓度二次预测结果和AQI值。问题三、四验证结果对比发现,与问题三相比,区域协同预测更能提升预报准确度。

关键词:多元线性回归系统聚类灰色关联度分析Kriging 插值BP 神经网络

链接:https://pan.baidu.com/s/1tlzVqZ-wgzUoOSpzjl_NUA?pwd=sngf
提取码:sngf

为您推荐

发表评论

电子邮件地址不会被公开。 必填项已用*标注