论文部分内容阅读
时间序列数据(以下简称时序数据)被定义为以相等的时间间隔进行连续测量的一组观测值,出现在现实生活中的很多应用领域,比如经济金融、工业生产、资源环境、科学创新。我们可以通过分析时序数据的潜在规律和机制,达到对时序数据的描述和解释,更好地认识各个领域中的现象以及探索其中的科学价值。更进一步的,通过对时序数据进行数学建模实现准确预测的功能,从而在不同应用领域中为决策者提供决策参考和前瞻性的指导。随着大数据时代的到来,时序数据通过不断地迭代更新,体现出越来越多的新特性。数据规模的爆炸式增长,维度的不断扩充,结构的复杂化等都为预测任务带来了不小的挑战。一方面,传统的时序数据预测模型存在多步预测精度随时间步长增大而降低的问题。较常规的预测方法为了保证预测的准确性,通常进行单步预测建模,然而在现实情况中,我们往往需要得到未来较长时间段的预测值来为实际应用提供支持,在这种情况下,就需要进行多时间步的预测工作。当前针对多步预测算法的研究中,多数算法采用融合单步和多步直接进行预测,这样会造成预测误差的累积,使得预测精确度大大下降;另一方面,传统的时序数据预测模型存在训练时间长,时间开销大的问题。在遇到海量数据的情况下,无法适应分布随时间不断变化的序列数据,无法实现实时处理和短时间响应。为了解决上述两个方面的问题,本文提出了一种基于VMD-Hybrid-RNN的时序数据多步预测模型,提升多步预测的准确性,得到更长一段时间的序列预测值,为提前捕捉时序数据的关键信息提供了一种更优的可行解决方案。本文主要的研究内容包括以下三个部分:1.通过分析小波、STL、经验模态、变分模态分解方法的效果和优劣,选取最优的变分模态分解方法作为本文的时序数据处理方法。利用该方法提取原始数据的频率特征,解决经验模态分解方法无法对模态混叠现象处理的缺点,并根据提取得到的有效变分模态分量分别代入循环神经网络模型进行训练。2.在上一步工作的基础上,运用集成学习的方法对分解得到的不同频率序列利用RNN相关模型分别进行建模,同时对每个序列模型重新调整底层优化参数,使优化环境更加平滑。让任何基于梯度的训练算法能够采取更大的Step,而不会遇到Loss的突然变化,通过迭代训练达到网络结构权重与参数的不断更新。最终,将各个预测结果序列进行重构,进一步减小模型训练误差。3.搭建ARIMA、SVR、BPNN、GRU等多种模型与VMD-Hybrid-RNN模型进行预测精度对比,验证本文所提出模型的优异性。此外,采用气候资料日值数据集(V3.0)对模型进行适应性验证,探究模型在多变量时序数据预测领域的预测效果和性能评估。相关实验表明,上述方法能够解决传统多步预测方案无法有效分解输入数据和提取重要信息的问题,以及在预测过程中会累积预测误差,导致多步预测精确度下降的问题。通过横向对比本文所提出的模型和其他预测模型,可以发现本文模型的时间效率和精确度更高,还能避免可能出现的梯度消失和内协变量移位等情况,在进行多步时序数据预测时有着极大的优势。同时,利用集成学习的思想,可以并行计算和优化每个分量的预测模型,保证时间效率一定的情况下,实现模型精度的进一步提升。