论文部分内容阅读
针对我国城市化进程带来的诸如空气污染、交通拥堵等突出问题,本文对城市时空序列预测这一城市计算核心技术进行研究。由于城市时空序列大数据具有的非线性、高维度和时空关联性等特点,如何有效地构建城市时空序列预测模型是城市计算面临的共性关键技术问题。深度学习技术作为一种新的处理大规模数据的机器学习方法,通过模拟人脑视觉皮层学习机制的多层非线性网络结构,实现复杂函数逼近,具有更强大的自动特征学习和特征表达能力。基于此,本文面向空气质量预测和交通流预测两大城市计算典型应用场景需求,将深度学习的多层自动特征抽取表达能力与城市时空序列数据的非线性、多模态和时空关联等分析方法进行深度融合,构建面向城市时空序列预测的多模态时空关联、时空注意力、变分自编码和混合建模等机制的新型深度学习模型。取得的主要研究成果总结如下:(1)针对城市空气污染预测预警核心问题,提出了一种新的空气污染(主要是PM2.5)预测深度学习模型。该模型首次基于混合深度神经网络架构来学习与空气质量相关的城市时空序列数据,并捕获隐含在城市空气质量数据中的时空相关特征和长时依赖性特征。模型设计基本模块包括多个一维CNN和双向长短时记忆网络(Bi-LSTM),前者用于提取时序数据的局部趋势特征和多序列间的空间相关性特征,后者用于学习数据中的长时依赖性与时空相关性特征,整个模型基于多个一维CNN和Bi-LSTM集成的混合深度学习框架构建,以支持空气质量相关的城市时空序列数据的共享表示与深度特征学习。基于两个真实的空气质量数据集进行实验评估与分析,实验结果表明该模型能够有效进行PM2.5空气污染预测。(2)在基于混合深度学习架构的城市空气污染预测研究基础上,采用一种新的半监督学习学习策略,并提出了一种新颖的扩展记忆机制的变分自编码器模型,以解决城市空气污染预测问题。这是一个端到端的深度学习结构,它结合了传统的变分编码潜在变量和记忆向量,用于城市空气质量相关时空序列的深度表示学习,编码器基于双向门控循环单元(GRU)深度网络,并基于神经图灵机的记忆机制辅助编码器网络进行深度特征的记忆和学习,从而获得城市空气质量数据中的长时依赖特征和深度非线性相关特征等。基于两个真实的空气质量数据集实验结果表明,与基准方法与前述混合深度学习模型相比,该模型具有更优的PM2.5空气污染预测性能。(3)针对传统交通流预测方法面临的瓶颈,提出了一种用于短时交通流量预测的多模态深度学习模型,该模型框架可以通过多模态深度学习策略来自适应地学习多模态交通流相关时序数据中的非线性相关特征和长时依赖特征。该模型的基础模块由卷积神经网络(CNN)和带有注意机制的GRU两类组件构成,每个基础模块对应处理一个模态的交通序列数据。CNN组件用于捕获局部趋势特征,GRU注意力模块用于捕获序列数据中的长时依赖特征。最后通过多模态深度学习集成框架,可以动态整合多个基础模块以对不同模态序列数据中的共享表示特征进行融合自适应学习。通过真实的交通流数据集实验结果对比分析,验证了该模型能够处理复杂的非线性城市交通流量预测问题。(4)在基于多模态深度学习框架的交通流预测研究基础上,进一步研究提出了一种新的序列到序列时空注意力学习模型,以提升城市交通流量预测的准确性和有效性。该方法采用了一种基于序列到序列学习结构并辅助时空注意力机制的端到端深度学习策略,通过设计实现一种基于卷积LSTM和具有时空注意力学习机制的序列到序列深度神经网络模型,可以有效地学习与城市交通流相关的多变量时空序列数据中的时空依赖性和非线性相关性等特征。基于两个真实交通流数据集的多维实验结果分析表明,与传统方法与最新基准方法相比,该模型具有最佳的交通流预测性能。