论文部分内容阅读
随着民航客运机票电子化,机票分销渠道和模式发生变化,随之而来的问题也不断增加,如利用航空公司的收益漏洞抢占座位,这种行为导致大量座位被浪费,给航空公司造成巨大损失。针对上述问题,本文对民航旅客订单数据进行挖掘,寻找其中存在的民航收益漏洞规则,为航空公司的决策提供支持。本文需要对民航旅客订单数据进行预处理,从大规模的高维数据中提取与可疑订单相关的数据,进而从特征和订单细分两个角度对民航订单数据进行规则挖掘。首先,构建了基于L1正则化逻辑回归的民航可疑订单特征提取算法,该过程利用L1稀疏性对影响订单的特征进行提取,同时通过回归系数可以充分挖掘不同特征对订单是否出票的影响程度。其次,从订单细分角度,提出一种ELM特征空间的kmeans算法对民航旅客进行横向细分。通过利用ELM算法将样本特征非线性映射到高维特征空间中,再使用NMF进行特征降维,最后将特征样本通过kmeans算法进行细分。实验结果验证了该算法的区分能力,并最终将民航旅客订单数据划分为五类,有效挖掘出提升民航收益的规则,为航空公司收益提升提供支持。在规则挖掘的基础上,构建了一种基于PSO-ELM特征映射KNN分类算法的民航可疑订单识别模型。该算法将样本进行非线性映射到ELM特征空间中,然后利用PSO算法进行ELM参数寻优,再使用KNN算法进行分类。通过民航订单数据实验结果的验证,该算法对民航可疑订单识别准确率为0.865,优于其他传统算法。