论文部分内容阅读
随着网络的普及,通信市场的用户已经趋于饱和,开发一个新客户的成本相对于挽留一个老客户要高得多,企业正在从用产品吸引新客户到挽留老客户的转变。与此同时,数据挖掘技术、深度学习的发展,企业越来越重视利用技术来进行客户的流失预测。本文的根据真实的企业数据,建立基于深度置信网络的电信宽带客户流失预测模型。结合了机器学习以及深度学习的优点,使用极限梯度树创造特征,深度置信网络进行建模。深度置信网络相比于反向传播神经网络,有着更好的全局搜索能力,使得模型能够更快,更好的收敛到全局最优解。本文首先分析了国内外对于客户流失预测使用的方法,其次,阐述了本文建立电信客户流失预测模型所涉及到算法、知识点。受限玻尔兹曼机、BP神经网络、极限梯度提升树。接着从XX省电信公司的系统中提取了XX市的客户基本信息表、客户活跃度信息表、客户投诉表、光猫功率表。对这些表进行数据集成、数据清洗、数据规约、数据转换。使用极限梯度提升树创造新特征,接着使用深度置信网络建立了电信客户流失预测模型。使用八月份的电信数据进行测试,得到模型在测试集面的精确率达到了90.45%,召回率达到了88.11%,F1分数达到了89.27%。同时使用深度神经网络、Lightgbm、随机森林等模型进行了对比。实验表明基于极限梯度提升树模型的深度置信网络能够很好的处理电信客户流失问题。