随机森林及其在移动用户消费行为中的应用研究

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:moccaaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着中国移动业务种类以及用户量的急剧上升,如何科学的对用户进行划分以及分析消费行为习惯,并针对性地提供合适的业务产品显得尤为重要。基于此本文提出了一套基于粗糙集进行高维数据的特征提取并结合随机森林算法构建中国移动用户分类模型的方法体系,与经典的随机森林模型进行对比分析,表明该模型的预测准确率以及分类精度都有较大的提升,同时以实际用户进行测试,也证实了此方法体系更适合中国移动的实际客观需求。本文在随机森林的理论基础上,对其定义、性质、基分类器、泛化误差和分类性能等进行了分析与总结,并详细的论证了收敛性、泛化误差界以及OOB估计。然后以中国移动用户数据为例,采用特征提取算法对移动用户高维数据进行降维处理,再结合随机森林算法构建用户分类模型,并针对分类结果分析各类用户的消费行为习惯。实验结果表明该模型的分类准确率达到81.12%,跟经典的随机森林模型相比,准确率也提升了3%-4%。证实了本文所构建的模型的可行性和科学性。针对最终分类结果,研究其消费行为习惯。高价值高流量的用户:主要分布在县内的街道;平均3个月话费超过50元;通话时长大于60分钟;平均3个月流量大于900M。因此为了满足通话和流量的双重需求,为他们推荐全球通套餐。高价值低流量用户:主要分布在县内街道和附近镇;月均通话费用超过50元;月均通话时长大于60分钟;平均流量小于100M。基于此,为其推荐数据普通卡和神州行实惠卡。低价值低流量用户:由于对通话和流量都没有强烈的需求,他们只希望能保持正常接听电话和短信,为此推荐月租较少的大众卡。整个论文体系为中国移动的经营决策提供了一种新的思路。
其他文献
目的:含顺式二羟基的物质多为生物活性分子,如糖蛋白、核酸、多糖、儿茶酚类等。但其在生物体内存在浓度一般较低,且会有高浓度干扰组分与其共存。现有的研究表明硼酸亲和材料可以实现对顺二羟基类物质的萃取和富集。1.本研究首次将硼酸亲和材料应用于毛细管固相微萃取技术,以将其实际应用于萃取富集饮品中微量顺式二醇类分子。2.为了能够提高硼亲和的特异性和结合常数,引入“组和硼酸”分子组,实现在分子内形成硼-氮配位
目的:通过分析慢性肺源性心脏病(Chronic pulmonary heart disease)患者血清尿酸(Serum Uric Acid,SUA)和心肌酶[包括天门冬氨酸氨基转移酶(Aspartate Aminotransferase,AST)
近年来,部分学者对川东北不同地区长兴组白云石化机理开展了相关研究并取得了较多认识,但针对白云岩成因认识明显存在争议。随着川东北地区长兴组气藏勘探开发的深入进行,白云岩成因成为明确储层形成机制和分布规律以及指导下步天然气勘探开发的关键因素。基于此,本论文选取川东北黄龙场地区长兴组白云岩开展岩心描述并样品采集,通过室内薄片鉴定、X衍射、阴极发光、扫描电显镜等岩石组构分析,以及微量元素,C、O、Sr同位
目的探讨股骨近端重建技术在髋关节翻修术中应用的可行性,以及术中、术后并发症、近期临床疗效。方法回顾性分析2015年1月至2018年11月于我院行髋关节翻修术且术中使用股骨近
海洋海绵生物为人类世界提供了取之不尽的生物活性素材。根据2001年Faulkner的一篇报道,Faulkner和他的伙伴们2001年从来自菲律宾海域的Myriastra Clavosa海绵生物粗提取物中分离出了一组结构新颖的天然产物——Clavosolide A及其一系列家族化合物,它有着一个16元的大环,并且整个分子具有非常好的对称性,同时具有多个对称的手性中心。本论文设计了一种新颖的、简洁、高
伏社锰矿床位于我国重要的锰矿产出地域-桂西南地区,具有重要的锰矿成矿远景。作为新发现的锰矿床,前人对矿区内的锰矿床研究还有所欠缺,本文主要通过对锰矿床的地质特征、成矿环境特征、矿物学特征等方面的研究,结合锰矿床地球化学分析,对伏社锰矿床的成因提出一些认识。天等伏社锰矿床主要赋存于上泥盆统五指山组地层中,主要锰矿体分布于五指山组1段和3段的硅质岩、泥质硅质岩、泥岩和粉砂岩等含锰岩系建造内。锰矿层严格
随着高质量蛋白质和DNA实验结构(X射线,核磁共振,冷冻电镜)的增加,为我们在大数据场景下提高对生物大分子内部相互作用的理论认识开辟了空间。虽然以往的研究已经从基于统计学上的距离分布和相互作用能等方面对不同形式的氨基酸-氨基酸以及氨基酸-碱基接触(范德华、氢键)的相对丰度进行了分析,但是对于其内部的物理化学性质的研究则相对较少。在本工作中,我们在紧束缚近似方法的基础上,直接对蛋白质-蛋白质和蛋白质
目的:研究青海地区藏族与汉族H型高血压患者亚甲基四氢叶酸还原酶(Methylene Tetrahydrofolate Reductase,MTHFR)基因C677T基因型及等位基因频率分布是否具有民族差异性,以及
随着钢铁生产工艺的改进和社会经济发展的影响,企业对钢铁冶炼系统的可靠性要求越来越高,钢铁冶炼系统的可靠性研究也越来越受到人们的重视。本文针对冶金系统存在多态、多阶段的特点,对高炉炼铁系统的可靠性问题进行了深入研究,研究内容主要有以下两方面:(1)基于MDD的高炉炼铁多态系统可靠性分析针对高炉冶炼系统中组件存在多态性的特点,提出一种基于MDD的高炉炼铁系统可靠性建模方法。首先对高炉炼铁系统的组件建立
与传统的检测方法(如离子选择电极法、伏安法、比色传感器)相比,由于荧光传感器的操作简单、灵敏度高、选择性好、快速的响应时间而被广泛的应用在检测、识别环境中和细胞中的