论文部分内容阅读
据民航局行业发展统计公报显示,2016年我国境内机场全年旅客吞吐量突破10亿人次,检查旅客托运行李2.92亿件次[1],许多枢纽机场部分设施,特别是值机环节已呈现超负荷运行状态。旅客办理行李托运是值机环节的重要组成部分,其效率的高低直接影响到旅客在航站楼滞留时间的长短。此外,随着自助托运行李,自助分拣等技术的日臻完善,很多新的问题亟待解决。目前在机场行李作业方面的研究,主要集中在先进设备与信息技术,值机流程仿真和资源优化等方面,从需求预测的角度研究机场行李的成果相对较少,且大部分研究为仿真建模,很少有基于真实数据的研究成果,通过仿真得到的结果与实际情况之间存在差异,无法真正投入生产。本文结合昆明长水国际机场的海量实际运行数据,分析离港旅客托运行李需求的时间分布特性、挖掘计划离港客流与托运行李的相互作用机理,并在此基础上构建托运行李需求长时、短时预测模型,最后通过实证分析,验证了研究成果的有效性和实用性。本文的研究成果概括如下:(1)为研究托运行李需求的特性规律,本文对昆明长水国际机场实际运行数据进行了一系列数据预处理,包括:数据删除、异常数据识别、数据插补等,并统计得到了不同时间段的行李需求数据与计划离港客流量数据。在此基础上,对托运行李需求的时间分布特性进行深入挖掘,研究结果表明:行李流具有日相似性、周期性和短期自相关性。采用Fisher有序聚类,将行李流划分为了五个状态区间。此外,本文还阐述了计划离港客流量与行李需求之间的作用机理,引入CCF相关系数,对二者在不同时间延迟下的相互影响的动态变化规律进行了分析,研究发现:不同时间段的行李需求与计划离港客流量之间具有互相关性和时滞性。(2)以行李流短期自相关性和周期性变化特征为基础,构建了基于SARIMA模型的离港旅客托运行李需求长时预测模型,以预测次日不同时间段的行李需求。实验结果表明:SARIMA模型能够较好地描述随机变量的内部特性,具有预测精度高,鲁棒性强的特点。(3)基于航班计划排班表及行李需求历史数据,构建了基于GBDT集成学习法的离港旅客托运行李需求短时预测模型,以预测下一个时间段的行李需求。首先,构建了高维特征工程,以获得有效且充分的模型输入变量。其次,针对行李流不同状态区间及计划离港客流量不同统计方法,设计了多种GBDT预测模型,结合昆明长水国际机场实际运行数据,对多种模型进行了训练、测试和分析,研究发现:以5min为时间间隔来统计计划离港客流量并作为模型输入变量时,相较于以10min 20min为时间间隔来统计计划离港客流量,可获得更好的预测效果。此外,对不同行李流状态区间进行单独处理,单独建模,可降低特征变量维度,有效提取相关度高的特征变量,以进一步提高预测精度。最后,基于以上分析,得出最佳模型设计方案,并对该方案进行了预测结果分析,实验结果表明:本文提出的GBDT短时预测模型具有较高的预测精度,满足机场实际运行需求。GBDT集成学习法在保证优越的预测性能和鲁棒性的同时,还能识别输入变量对预测结果的相对影响度,揭示复杂问题中各因素的相互作用关系。准确的长时预测结果可以帮助机场提前分配行李运输相关资源,合理制定工作人员排班计划;准确的短时预测结果,对于动态优化离港流程,智能分配航站楼资源具有重要的意义。本文所建立的离港旅客托运行李需求长时、短时预测模型具有准确性高,实用性强的特点,可为建设智慧机场提供科学的决策支持。