随着人类日常生产活动以及自然过程的发生,某些物质进入大气中,经过一段时间的累积,到达足够的浓度,就有可能危害人类的健康甚至危害生态环境。因此,需要构建空气质量预测模型来提前预测可能发生的大气污染并采取相应管控措施。典型的预测模型通常基于WRF-CMAQ模拟体系,但是受限于当前模拟条件和污染物生成机理理论的研究,这些预测模型结果并不理想。因此,可以参考污染物浓度实测数据进行二次预测,本文在第一问中首先进行数据查看,按照规则计算AQI和首要污染物,发现污染物浓度和气象条件之间具有一定关联:在第二问中使用KNN插值法对缺失值进行拟合,使用3口原则剔除异常值,使用皮尔逊相关系数和折线趋势图等分析气象条件对污染物的影响程度;在问题三中,本文考虑了监测站点间个性与共性的关系,即站点间符合同一的污染物变换规律且站点间污染物变化的规律受所在区域人文自然因素的影响,基于此提出了GAN-Stacked-BiLSTM-MLP模型建模适用于A、B、C三个监测点的二次预报数学模型;在第四问中,本文考虑到了监测站点间的时空相关性问题,提出了时空注意力预测模型PGAN对不同站点的污染物浓度进行精准预测。
针对问一:首先进行数据查看,包括缺失值和异常值分析,使用了3a原则和箱型图来进行异常值的探索和可视化:然后计算臭氧最大8小时滑动平均值,作为计算臭氧的IAQ值的基础:接下来根据AQI和首要污染物的定义计算并划分等级。
针对问题二。首先处理数据,剔除异常值,使用最近邻等多种插值方式进行拟合:然后使用皮尔逊相关系数分析气象因素之间的相关性、污染物之间的相关性以及二者之间的相关性:接下来通过绘制折线趋势图探索气象因素对污染物的影响,使用不同的时间粒度,查看气象因素和污染物浓度之间的相关性:最终得到气象分类和各类的特征。
针对问蕙三。对于跨站点多元污染物浓度通用预报模型。首先,本文从时序信号预测问题为切入点,选用改进的长短期记忆网络LSTM榄型对由污讯物液f及从的子的亏顶湖据构成的时序信号进行建模:其次,考虑到污染物浓度与气象数据间存在多元影响的复杂关系以及预测任务属性的多元性特点,对单变量的LSTM模型进行扩展,并采用迭代形式预测未来三日的六种污染物浓度变化情况:最后,对于跨站点通用模型的目标,本文使用对抗生成网络GAN对站点间客观存在的差异性特点进行消除,使得模型在跨站点预测中拥有较强的泛化性能。本文提出了一种GAN-Stacked-BiLSTM-MLP,适用于A、B、C三个监测点的二次预报数学模型,用来预测未来三天6种常规污染物单日浓度值.
针对问题四:对于多站点污染物浓度联合预测问题,我们从时空两个维度进行研究。时间维度,我们考虑到了污染物的动态连续性:空间维度,我们考虑到了污染物的空间动态扩散运动。本研究问题中,我们关注时空因素,并提出了一种污染物图注意网络(PGAN)来预测网络节点上不同位置前方时间步长的污染物浓度状况。PGAN采用编码器-解码器架构,其中编码器和解码器均由多个时空注意块组成,以模拟时空因素对污染状况的影响。编码器对输入数据特征进行编码,解码器预测输出序列。在编码器和解码器之间,应用transformer注意力层来转换编码的输入数据特征,以生成未来时间步长的序列表示作为解码器的输入。Transformer注意力机制对历史和未来时间步长之间的直接关系进行建模,这有助于缓解预测时间步长之间的错误传播问题。
关健词:污染物浓度预测:AQI:向量自回归模型VAR:长短期记忆网络LSTM;对抗生成网络GAN; PCA:多元变量线性回归模型:时空注意力模型PGAN:时空相关性
链接:https://pan.baidu.com/s/1pR2l4IMjCI3KHgDbIIJFeA?pwd=wmi8
提取码:wmi8