论文部分内容阅读
随着中国互联网“人口红利”和“移动红利”逐渐消失,互联网电子商务领域的竞争日臻激烈,通过粗放式的低价营销来吸引新用户和维护老用户的方式已经难以为继,精细化的用户运营方式逐渐在各个成熟型电商公司得到认可。精细化的用户运营需要对用户在网站中所处的生命周期、用户的忠诚程度有更加深入的了解和判断。在大数据技术发展前期,老用户的流失大多都是基于用户最后一次的消费时间来判断,这种划分方式有一定的滞后性,而用户一旦已经流失再去采取挽留措施,效果通常不佳。随着大数据存储、大数据挖掘和分析技术的兴起和发展,基于数据挖掘算法来预测客户是否会流失成为了可能。基于数据挖掘的方法来构建用户流失预测模型在电子商务平台的用户运营中是一个非常重要的课题。本文在查阅大量关于流失客户研究文献的基础上,针对电子商务领域的客户流失问题展开了具体的研究。首先,详细阐述了电子商务当前针对流失用户研究的重要性和必要性。其次,简单介绍了客户关系管理和数据挖掘相关的理论概念,详细论述了Logistics算法和XGBoost算法的理论概念和具体公式推导。再次,以某一电商公司的真实数据为基础进行实证分析,围绕用户的基本信息,近期订单数据,评价、登录和签到等浏览行为数据选取了二十多个对分析用户流失有意义的关键指标,构建了基于Logistics回归和XGBoost算法的用户流失预测模型。模型构建完成后,通过输出混淆矩阵结果计算模型的准确度、精确率、召回率和输出ROC曲线图对模型进行综合评估,最终模型准确度达到76%,且通过XGBoost模型得出了预测用户流失中各个指标变量的重要程度,分析流失用户的具体特征。最后,提出了应该结合用户调研的方法深入分析用户具体的流失原因,并针对不同类型的流失用户采取不同的营销策略,提高用户运营效率和节省运营成本,提高企业的经营利润。论文的最后总结了本次研究的主要结论,对用户流失预测模型的应用给出了相关的建议,并对本论文有待深入研究的几个方向提出展望。