论文部分内容阅读
中国图书市场随着经济发展市场规模不断扩大,各地纷纷建立大型图书城。目前图书市场竞争激烈,各图书零售企业为了抢占市场实施会员制销售,拥有读者就掌握了市场。随着信息系统普及,企业拥有海量会员销售数据,但这些数据并没有充分利用。因此如何从中挖掘出高价值信息,为读者提供更人性化服务,保持和发展高价值读者,制定高效推广策略,这对图书企业有着重要的研究意义。本文通过定性和定量分析相结合,理论和实际研究相结合以及多学科理论相融合的方法,对数据挖掘技术在图书零售企业的客户管理进行了应用研究。在理论上归纳分析了客户管理理论及数据挖掘相关理论。在实际研究上,采用CRISP-DM商业挖掘流程标准,使用挖掘工具SPSS Clementine对所在企业的会员销售数据进行研究。本次应用研究主要有:第一采用Apriori关联算法根据实际需求建立图书购买关联模型,将销售数据预处理和两两分组后进行关联分析找出图书购买之间的关系,并根据图书销售数据特点设置合适的关联支持度和置信度,分析结果以检验算法在该应用的有效性,算法产生的规则将用于会员个性化推荐等方面。第二采用K-means和Two-Step聚类算法对消费会员的基本特征信息建立聚类分析模型,并将会员销售数据提炼处理供模型使用,分析采用两种算法聚类结果对比分析法,分析两种算法实际应用的优劣,并选择较优聚类结果以会员平均每笔消费码洋为指标采用直方图的形式分析该类会员消费情况,根据分析结果找出高价值和高发展潜力会员的特征,以方便营销部门制定营销计划。第三采用Two-Step聚类算法建立会员注册喜好图书类别真实度分析模型,根据分析模型生成相应的真实度挖掘数据,利用模型对会员注册时喜好图书类别和会员实际购买图书类别进行聚类分析用于对会员注册喜好类别真实度评估,分析中根据分析字段属性值的情况并采用SIL等聚类有效性指标对聚类的聚类数评估分析确定,合适的聚类数将对聚类结果起到关键作用并对后续的分析产生重要影响,利用聚类结果得到会员注册喜好信息的真实程度,为营销部门的营销推广提供技术支持。此外对各挖掘模型的挖掘结果总结,分析其在实际应用中的优劣,并在实际应用中针对性的调整以帮助企业提升会员价值,实现企业利润最大化。通过本文的研究可以让图书零售企业充分利用现有销售数据,提升会员的管理水平,提升客户的贡献度,从而帮助企业获得稳定的读者群和竞争优势。