论文部分内容阅读
2013年,交通运输部引入“无车承运人”模式,在随后几年间发布多项政策和措施,规范和促进了无车承运人平台的发展,并于2020年将无车承运人平台正式更名为网络货运平台。网络货运平台的出现在一定程度上解决了我国公路货运市场的物流成本居高不下的问题,随着网络货运平台的快速发展,越来越多的承运人和托运人用户加入到网络货运平台。网络货运平台依托于移动互联网技术,近些年移动互联网的快速发展,移动互联网中出现了各种各样的异常用户,而有着移动互联网特性的网络货运平台同样也存在着异常用户。由于网络货运平台承运人用户规模较大,涉及到货物运输和运费交付等行为操作,本文将研究主体确定为网络货运平台的承运人异常用户。网络货运平台在运营过程中,产生了大量的订单交易数据和承运人用户数据,为了帮助网络货运平台更好的识别和预测承运人异常用户,本文希望通过数据挖掘技术有效利用网络货运平台大数据,识别预测出平台承运人异常用户,从而为网络货运平台科学管理承运人用户提供有利的支撑。本文借助数据挖掘技术,以网络货运平台A平台为例,对平台承运人异常用户的识别预测进行研究。本文首先论述了网络货运平台和异常用户的识别和预测的研究现状,介绍了网络货运平台、异常用户和数据挖掘等方法理论,由于网络货运平台承运人异常用户尚未明确定义,本文在借鉴了各学者对于异常的定义和各领域异常用户的定义,给出了网络货运平台承运人异常用户和承运人正常用户的定义。然后介绍了数据挖掘相关知识,并以网络货运平台A平台为例,从A平台提取订单数据和承运人基本数据,对数据进行数据预处理、探索性分析和特征工程等操作,根据指标体系构建的原则和方法,结合A平台实际情况,构建了承运人异常用户指标体系。最后,对处理后的数据进行标准化处理,使用K-Means聚类对A平台承运人用户的数据进行聚类并对聚类结果进行分析,将A平台用户分为正常用户、高风险异常用户和低风险异常用户,分别对不同用户群进行特征分析,为A平台识别异常用户和管理不同用户群体提出相关对策建议。考虑到网络货运平台会预测更多的承运人是否属于异常用户,以K-Means的聚类结果作为原数据集,由于三个用户群样本数据处于非均衡状态,使用SMOTE过采样方法使样本数量均衡,分别使用随机森林、SVM和Xgboost三种分类算法进行分类预测,对预测结果进行分析并为A平台提出了相关建议,以帮助网络货运平台识别和预测承运人异常用户。本文借助数据挖掘技术,对网络货运平台承运人进行识别和预测研究,并根据结果提出了相关对策建议,帮助平台管理用户提供了数据支撑,提高了平台承运人用户粘性和忠诚度,对网络货运平台的发展有较高的实际意义和参考价值。