论文部分内容阅读
空气污染物浓度“爆表”成为我国社会关注的热点问题之一,空气质量预测的准确与否对于人体健康、疾病防控等活动具有现实意义。为此,本文从数据科学的角度出发,引入LSTM神经网络为预测工具,并在“分解-集成”范式下提出了一种VMD-ELSTM-GS混合预测模型,用于兰州市的空气质量预测,期望提高目标污染物的预测精度。同时,开发静态网页用于及时发布预测结果。本文主要工作包括:第一,阐述了气象、空气质量监测数据的数据探索、预处理过程,并引入LSTM神经网络用于空气质量预测的实际任务。具体来讲,在缺失值处理、离群点处理和数据整形等理论基础上实施数据预处理,改善数据质量;以相关性理论为基础进行特征选择;构造适应时间序列预测要求的LSTM神经网络模型进行空气污染物的多指标预测。第二,为进一步适应空气质量数据多指标、高波动、非平稳、含噪音的特点,提高预测精度,提出了一种VMD-ELSTM-GS预测模型。具体来讲,在优化算法、信号分解、深度学习和正则化等理论基础上,构建了一种混合的、多模态集成的预测模型用于空气质量的预测研究。将此模型用于兰州市的2016-2017年的气象、空气质量数据集的实证过程,在均方根误差(RMSE)、绝对值误差(MAE)两个评价指标下将此模型与实验组方法对比,实证表明了此模型的优越性、有效性。第三,开发了一个静态网页用空气质量指数及污染物浓度预测结果的发布,并简介了它的发布过程,在技术层面上实现了空气质量预测结果及时、方便发布的目标,为半结构化数据的实际应用探索途径。