【摘 要】
:
时间序列数据是在不同时间上收集到的数据,用于所描述现象随时间变化的情况。这类数据反映了某一事物、现象等随时间的变化状态或程度。时间序列数据在现实生活中广泛存在,例如金融领域中的交易数据和经济统计数据、消费电商领域中的用户浏览和购买数据、医疗领域中的医疗器械的信号记录、天气监测站记录的天气指标数据等这些时间序列数据是相应领域的非常宝贵的数据资源,对这些数据的准确、有效分析和利用能够帮助减小人力成本,
论文部分内容阅读
时间序列数据是在不同时间上收集到的数据,用于所描述现象随时间变化的情况。这类数据反映了某一事物、现象等随时间的变化状态或程度。时间序列数据在现实生活中广泛存在,例如金融领域中的交易数据和经济统计数据、消费电商领域中的用户浏览和购买数据、医疗领域中的医疗器械的信号记录、天气监测站记录的天气指标数据等这些时间序列数据是相应领域的非常宝贵的数据资源,对这些数据的准确、有效分析和利用能够帮助减小人力成本,提高生产效率,提高经济收益。时间序列预测通常是依赖于相互关联的多因素的非线性拟合问题,我们对关联多元时间序列的预测应该同时考虑到序列内的时间依赖关系与变量依赖关系和序列间的空间依赖关系。自回归移动平均,差分整合移动平均自回归等传统时间序列模型难以对复杂非线性时间序列数据进行有效建模;多元线性回归,神经网络等机器学习方法不能很好地捕捉时间序列中的长时依赖,只能利用固定长度的数据序列来进行预测,受限于模型容量,难以达到最佳预测效果;长短期记忆模型(LSTM)是基于循环神经网络之上存在“记忆体”的模型,可以记住很长时间的信息,有效解决长期依赖问题,并且作为深度神经网络,具有超强的拟合能力,在复杂非线性时间序列数据的处理方面有着天然的优势,因此本文提出一种通用的基于LSTM的时间序列预测模型CA-LSTM(Convolution and Attention based on Long Short Term Memory)。卷积的长短期记忆模型可以有效提取序列内部的变量依赖特征与时间依赖特征和序列间的空间依赖特征,使得算法对信息的考虑更加全面且运行结构与规律更加清晰;注意力机制对所有时间步的隐藏层状态进行加权,把注意力集中在所有时间步上比较重要的隐藏层状态信息,增强了模型的可解释性,对更长的时间序列预测效果更加明显。为了验证模型的有效性与通用性,本文通过环境领域的空气质量预测和交通领域的出租车客运需求预测两个关联多元时间序列预测实例,对数据进行归一化、缺失值与异常值处理、特征编码、主成分分析降维,并从梯度下降方法选择,超参数调节等方式优化模型,以根均方误差,平均绝对误差作为评价指标,并画出训练、测试损失图,拟合图,与多层注意力机制模型、长短期记忆模型模型、多元线性回归模型、全连接神经网络模型、查分整合移动平均自回归模型五种基准模型预测结果进行对比,实验结果表明CA-LSTM具有更好的预测效果。
其他文献
超短脉冲激光的出现为科学研究提供了强有力的工具。尤其是,飞秒紫外激光具有波长短、单光子能量高和时间分辨率高等特点,在物理化学、生物医学以及超精细微纳加工等方面具有重要的应用价值,但大多数超短脉冲激光器输出波长集中在近红外和中红外波段,因此,通常需要通过频率变换获得飞秒紫外激光。而飞秒激光谐波变换过程中存在群速度失配、高阶非线性效应等效应,很大程度上限制了频率转换的效率,因此开展这方面研究有着重要意
2016年新颁布的神经系统肿瘤分类指南中以异柠檬酸脱氢酶(Isocitrate dehydrogenase,IDH)基因表现型为基础对脑胶质瘤进行系统分类。由于现有基因型诊断技术的周期长且有额外创伤,而核磁共振成像技术(Magnetic resonance imaging,MRI)拥有无创、快速和可重复的优点,将其与人工智能方法相结合能做出人力所不能及的医学判断。所以,本文旨在利用多序列MRI技术
极化码因其特有的递归结构特性以及较低的编译码复杂度,在通信领域备受关注。在其译码方面,连续删除(Successive Cancellation,SC)译码的改进算法性能很好,但因其固有的串行结构,对于较长码字而言,其时延和吞吐率并不满足高速通信的要求,因此其在5G通信中只适用于短码场景。由于神经网络强大的学习能力及离线操作,在目前的研究中已经提出将各种类型的神经网络和极化码相结合,来改善译码性能和
由于互联网的普及,使得对无线通信系统的探索愈来愈热。而在无线通信系统的研究工作中,提升射频收发机的性能是研究之重。一个射频收发机系统主要由LNA(低噪声放大器)、混频器、ADC/DAC(模数/数模转换器)、PA(功率放大器)、频率合成器以及滤波网络等功能模块组成。VCO是PLL频率合成器中的核心模块。VCO的调谐范围确定了PLL系统的输出频带,相位噪声和功耗性能对PLL乃至整个无线收发机系统有很大
与均匀阵列相比,稀疏阵列具有更低的阵列互耦和更高的自由度,在相同快拍数下有着更小的数据运算量,近些年来受到雷达、水声及电子战领域的广泛关注。将稀疏阵列搭载在运动平台上,利用被动孔径合成技术构造虚拟合成阵列,是众多改善稀疏阵列结构的方法中相对简单的一种,相比于设计新的稀疏阵列而言更具有研究意义与价值。而目前国内外对稀疏阵列进行优化设计时大多只基于自由度和互耦等结构性参数展开,并没有将信号源DOA和信
近年来,随着卷积神经网络和三维数据获取技术的不断发展,三维目标检测技术已经成为计算机视觉和自动驾驶领域的核心技术之一。与二维目标检测技术相比,在三维空间中进行目标的位姿估计对于实际应用场景更加重要。相比于二维图像数据,三维点云数据具有不受遮挡、光照变化影响且含有目标的位姿信息的优点,然而没有提供语义信息;二维图像数据具有丰富的语义信息,然而易受遮挡、光照等的影响且不含有目标的位姿信息,所以,它们二
本文基于电磁波在大气中的传播规律,分析了在地-电离层波导中透射电磁波传播路径的求解方法,研究了超视距下电波的传播特性。针对微小区电波传播预测算法对环境变化适应度不高的问题,本文采用遗传算法结合实测功率数据反演了给定环境的最优电参数,提高了微小区电波传播预测算法的仿真精度与环境适应性。将智能优化算法与优化后的微小区电波传播预测算法相结合,研究了基于网规网优理论的微小区最优化基站位置的获取方法。本文的
随着经济的不断转型和发展,企业核心竞争力已经成为企业发展的关键,对于非核心业务,企业往往选择将其进行业务流程外包。在大型设备的销售过程中,往往需要生产商提供安装及调试服务,但受到地域、工期等因素的影响,生产商通常选择将安装及调试服务外包给第三方施工队。在这种情况下,传统做法是通过电话沟通、现场监管、做工作记录来跟踪监控施工进度。但是,这种传统管理方式往往会带来各种问题,如施工效率过低、数据不易保存
自2018年李克强总理提出“互联网+政务服务”概念以来,国内的政务智能问答系统不断涌现。但是大多数的政务问答系统都是基于知识图谱的检索式问答,由于实体和关系的抽取比较复杂,导致知识图谱的构建需要耗费大量的时间和人力。随着深度学习技术在自然语言处理中的广泛应用,目前也出现了一些基于机器阅读理解的问答系统,但是由于这些机器阅读理解模型结构设计过于简单,只能适用于一些简单问题的回答,对于多跳推理的复杂问
机器人作为一个非常复杂的多输入输出非线性系统,具有强耦合、时变和非线性的动力学特性。目前,在大多数传统的机器人控制系统中,由于各执行机构单独工作,与其它机构之间没有信息交流,从而执行机构之间缺少同步协调性。而多轴系统交叉耦合控制技术的提出为机器人系统协调同步控制问题提供了一个解决方案。目前大多数多轴机器人系统的同步控制都只是达到渐近稳定,而在实际情况中,机器人系统不仅要精确地到达控制目标,其收敛所