基于数据挖掘方法的用友用户画像及流失预测模型研究

来源 :东北财经大学 | 被引量 : 0次 | 上传用户:yangyan215076379
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的不断发展,互联网逐渐呈现出信息传递、实时沟通、货币交易等特点,人类在互联网中产生了大量数据。企业通过服务用户获得收益,用户发挥着越来越重要的作用。目前大多数企业越来越注重利用大数据为用户提供精准营销服务,进而挖掘用户的潜在商业价值。利用用户消费行为数据对用户进行画像,可为之后的用户群体划分,用户与产品的关联与推荐等提供理论基础,所以用户画像有极其重要的应用场景。根据用户自身特征实现用户画像,为用户提供精准服务,值得深入研究。如何在大数据的基础上分析用户的特征,从而针对不同用户群体提供精准服务是一个非常有意义的研究问题。另一方面,随着国内互联网人口红利的消失,获取新用户的成本会愈加高昂。企业发展已由“增量”客户模式转为“存量”客户模式,而用户流失率就如同水库的出水口,流失率较高就意味着出水速度快于进水速度,水库中的水位线难以升高。所以企业要想精益化运营,降低用户流失是个很关键的问题。通过定期找出即将流失的用户,可让运营人员针对性地挽留这些用户,这样会大大减少人力及时间成本。及时采取挽留措施以预防客户流失亦值得深入研究。本文的研究内容如下:首先,研究用友公司的用户画像问题。在用友公司友空间产品线中,基于用户近三年的订单数据将用户属性特征所购产品、大区、行业、订单年份及月份等进行描述性分析,考虑到从三年总体属性特征看不能详细反映订单是否受年份影响。因此本文将各属性特征进行年份交叉分析,并使用K-means聚类分析基于订单金额及购买人数数据将用户分为四类,分别为VIP用户群、主要用户群、普通用户群、小微用户群。以往用户画像针对个体用户进行分析,本文创新性地以B端用户(企业)为目标用户进行分析,指标特征发生改变,出现企业所在大区、企业的行业类别及企业的购买员工数等特征。其次,针对以上划分出的四类用户群,将用户的基本属性特征与订单金额及购买人数类别采用基于Apriori算法的关联分析法进行关联,对VIP用户群、主要用户群、普通用户群、小微用户群四类群体分别进行画像,分析各用户群特点,从而更好的为用户提供细化服务、精准服务。若用友公司实现用户画像,则可为一线销售人员提供指导意见,亦可大大减少时间、金钱成本,也可实现精准营销,快速达成交易,同时也可将该研究成果应用到服务对象为企业的公司。最后,构建客户流失预测模型。针对样本数据不平衡及样本量较少的问题,本文创新性地使用Python进行Bootstrap重抽样技术将样本数据向平衡靠拢并将小样本扩充。将用友公司友空间产品线的客户订单数据及行为数据结合分析,使用Python分别用Logistic回归、决策树、随机森林、SVM、KNN五种算法构建客户流失预测模型。虽然SVM准确率较高,但十折交叉验证结果显示其训练模型不稳定,有时会出现预测结果全部正确的情况,有时亦会出现全部错误的情况,因此该模型无法应用于实践。最终得出随机森林的分类效果好,模型准确率为81%左右,ROC曲线下面积为0.92。从而可将该流失预测模型应用于实践,针对性地预测即将流失的客户,可让运营人员制定挽留策略,从而大大减少时间、人力及金钱成本。
其他文献
自2012年国务院对农村义务教育学校进行布局调整后,以村小和教学点为主要形式的农村小规模学校得以保留和发展,是我国农村教育的重要组成部分。农村教师作为农村小规模学校教育和教学的主力军,其专业发展是促进农村教育质量提升的重要保证。因此,我们有必要且迫切需要关注小规模学校教师专业发展。本研究以叶澜教授的教师专业素质结构和专业发展标准为理论依据,将教师专业发展分为专业理念、专业知识和专业能力三个维度,并
随着政府职能转变,深化监管体制改革发展战略的提出,证券交易所的一线监管模式发生改变,一些非处罚性监管措施及政策相继出台并开始发展使用。这其中,以问询函作为载体的监管问询制度是我国证券机构在吸取国内外监管经验的基础上所做出的制度创新。监管问询通过对上市公司进行全方面的“体检”,发现并及时询问上市公司在市场交易及信息披露过程中存在的异常问题,并将所有问题公开化,并依据相关法律法规或规则对上市公司提出问
在开展统计工作过程中,最需要把握的一点就是统计数据的质量如何。作为统计部门,最终提供给社会公众的统计数据能否做到精准客观、真实可靠,将直接关系到该部分统计数据是否可以真实、是否能够客观地反映社会和经济的运行发展状况,是否符合社会各个层级对数据的需求,是否能在政府决策时为其提供有力数据支撑依据,以及能否引领和进一步促进科学发展。统计数据质量的高低,不仅直接关系到政治决策科学程度和精准程度,而且还将对
一直以来,我国素质教育都强调着青少年的社会行为发展的重要性。从宏观角度看,青少年的社会行为发展情况受到全社会的共同关注,其揭示了我国的教育现状,引导青少年的社会行为向正确的方向发展,也为我国未来国民素质打好基础;从微观角度看,青少年的社会行为发展情况是青少年社会化的重要组成部分,会对后续阶段产生不可忽视的影响,健康的社会行为发展促使青少年更加客观正确地了解自己,在如何适应环境的问题上找到更适合自己
改革开放以来,随着我国经济的快速发展,资源不足、环境恶化等问题也随之出现。作为主要的生态环境污染者和资源消耗者的企业,其环保责任行为将在社会上引起人们的关注。其中,重污染企业本身对环境治理的需求较大,被认为是环境治理的关键推动者。然而,在现实中,一些企业由于短视或侥幸的心理,对环保责任做出了消极的逃避反应。同时,生态文明的建设为推进国家环境会计的发展提供了优良的机遇,也为环保投资研究提供了新的视角
朝鲜半岛位于东北亚的核心地带,周边主要大国的利益和政策与朝鲜半岛的局势有着极大的关系。冷战结束后,韩国对朝政策起伏不定,朝韩关系发生了数次明显的波动。探究韩国对朝政策的发展历程、分析韩国对对朝决策过程中的各种倾向及影响要素,进而探究其中规律性的内涵,明确其面临的问题,判断韩国对朝政策的未来走向,对实现朝韩关系良性互动、维持半岛和平稳定、推进地区发展与繁荣,具有十分重要的意义。探究韩国对朝政策演变的
社会体育指导员是我国体育事业的重要组成部分,并能直接的影响到全民健身活动的开展情况,对丰富群众的业余生活,提高身体素质,有着重要的作用,随着近年来我国经济突飞猛进的发展,人民生活品质的提升,使群众对健身的需求度加大,公益性社会体育指导员队伍现状是否满足大众健身需求,把握现状、寻找存在问题。提出相应对策,对当地社会体育指导员队伍发展有着重要意义。本研究以铜川市公益性社会体育指导员队伍现状及发展对策为
近年来,多种时间序列预测模型在经济及社会领域得到了广泛的应用,并在不同领域中发挥着重要的作用,对社会中各行业的未来发展提供了有价值的参考信息。在股票市场中,大部分股票指数的时间序列可以通过统计学方法来构建预测模型,这些模型可以对股票市场未来可能发生的变化进行推断和预测,由于这种方法既可以避免繁杂的数据获取过程,又可以减少冗余信息的干扰,因此得到了许多学者的青睐。与此同时,股票指数预测对帮助投资者形
目前我国经济处于高质量发展的阶段,经济发展速度逐渐放缓,现阶段提高全要素生产率有助于经济向着更好的方向发展,也可以在一定程度上提升经济发展速度。在经济处于高速增长的这一阶段时,我国许多地区为了实现经济快速增长,仅仅注重发展的速度,忽视了经济发展质量和效率的提升,导致出现了很多的问题,在发展中不仅浪费了很多的资源,而且对资源的利用情况也十分不理想。所以在未来经济发展中应该合理的调整资源利用情况,在避
收入不平等是全球各国都面临的一个亟需改善的大问题,它不仅与个人的利益密切相关,还将影响到世界各国经济社会的持续健康发展。从改革开放以后,中国经济发展十分迅速,使得人民生活也产生了巨大变化。与此同时,居民的收入水平差距持续拉大,贫富差距悬殊。收入不平等的现象将不利于我国全面小康社会的建成。根据党的十九大报告相关内容表明,新时代我国社会的主要矛盾在于发展不平衡不充分的问题,而其主要表现为居民收入不平等