论文部分内容阅读
目前,大数据和人工智能技术的飞速发展惠及了各行各业。在民航领域,智慧机场、智慧空管的概念也早已提出,大量智能化民航应用逐渐落地,航班延误是民航领域一直关注的重难点问题,迫切需要实现高精度的延误预测。因此,本文以此为目标,提出利用基于大数据深度学习的方法进行航班延误预测,旨在通过高效智能的算法挖掘延误数据的潜在价值,为空管、机场、航空公司等相关部门决策提供参考。论文主要研究工作如下:首先,论文在结合航班自身数据特征、考虑航班延误多种影响因素的前提下,利用大数据分析技术分别对航班自身信息、天气信息、关联机场延误波及属性数据进行预处理,研究三种特征信息对航班延误的影响程度。详细介绍了三种数据集的特征属性含义以及数据预处理过程。同时,为进一步提高航班延误预测的精度,提出了一种数据融合的方法,利用关联主键合并的方式将三种特征信息同时输入网络中。其次,针对传统卷积神经网络(Convolutional Neural Networks,CNN)深层训练时特征信息易损失导致梯度消失的现象,基于DenseNet(Densely Connected Convolutional Networks)算法构建航班延误预测模型。该模型利用密集连接的设计方式进行特征自动提取,选择Softmax分类器进行最终延误等级的预测。其中,DenseNet网络采用瓶颈-压缩(Bottleneck-Compression,BC)层和填充(Padding)技术进行模型优化。实验使用预处理后的美国空域航班数据进行航班延误预测实验,预测精度较传统CNN有较大提升,最终准确率达96.82%。最后,虽然DenseNet网络特有的密集连接能解决深层训练时的梯度消失现象,但也会导致大量的冗余信息复用,没有从特征维度层面出发学习特征通道间的权重相关性,降低了特征提取过程的效率。针对上述问题,提出了一种SE-DenseNet网络(Squeeze Excitation-Densely Connected Convolutional Network)。该模型在DenseNet结构的基础上,在每个密集块融入了用于权重自适应标定的“SE模块”。实验结果表明,算法改进后SE-DenseNet各方面性能均优于DenseNet,模型最终准确率达97.51%。同时,对航班延误影响因素进行分析,预测准确率分别为91.36%,97.03%和94.96%,表明三种特征均能对延误产生影响,但气象信息影响最大。