论文部分内容阅读
大数据环境下的电信客户分群模型研究与设计,不仅具有很强的研究意义,还有极高的商业价值。应对大数据在模型构建与计算上的挑战,满足网络信息空间大数据挖掘的需求,开展大数据的计算研究,是国家973计划信息科学领域一大研究方向。本文的主要工作有以下三个方面:其一,基于业务特点对聚类分析算法在电信客户分群案例中的深入分析与选择;其二,聚类分析模型设计;其三,面向大数据的电信客户分群原型解决方案进行研究与设计。具体而言,本文工作阐述如下:首先,本文在查阅相关文献和分析客户分群业务问题特点的基础上,提出采用基于K-均值聚类的方法进行电信客户分群,进而提出整个客户分群的框架,即宏观层次上的客户分群和微观层次上的子群分析。本部分详细探讨了在安徽某电信业务数据上的的客户分群方案,重点阐述了数据源分析、数据预处理、数据整合的步骤;此外,在客户分群的指标选择上,从价值和行为属性两个大维度对指标体系进行构建。其次,本文设计并实现了大数据电信客户分群原型系统。系统总体遵循分层模块化设计准则,在系统总体架构上,构建包括数据层、模型层、应用层的三层体系结构,总体功能设计上,设计包含了客户理解、营销策划、营销执行、营销评估、自助取数5个主要模块在内的原型系统,系统实现方面,采用快速原型开发编程语言Python,利用基于Python的Web框架Django,进行系统B/S架构设计,数据库层面引入NoSQL数据模型,混搭使用主流的NoSQL数据库产品,进行系统数据层的设计。本文主要的贡献包括以下几个方面:1、在客户分群系统中采用数据挖掘的聚类技术,通过挖掘客户的基本资料与客户消费行为信息,输出聚类规则,对客户进行细分,之后针对不同的群体采用精准营销定位,发展新用户、保留老用户;2、设计并实现了面向大数据的电信客户分群系统,具有良好的应用前景;3、针对大数据海量、时变、关联的特性,引入NoSQL数据模型,重点解决大数据环境下用户特征的存储问题。