K-means加权聚类融合模型在App市场细分中的应用

来源 :重庆大学 | 被引量 : 0次 | 上传用户:feifeichongwx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析作为数据分析和数据挖掘中的一种重要方法,已经被广泛应用于市场分析、金融分析、图像处理等行业。作为一种无监督的统计学习方法,聚类在对无序和无先验信息的对象处理中意义重大。特别是在大数据时代,数据有着数据量大及价值密度低的特点,聚类分析就显得日益重要了。聚类分析发展比较迅速,算法比较丰富。聚类融合算法从A.L.Fred和A.Strel提出以来,由于其比一般的聚类方法有更好的特性,深受到人们的重视。在移动互联网的快速发展中,手机应用软件(App)变的数目众多,而质量却参差不齐。对App进行市场细分就显得日益迫切。本文主要在K-means加权聚类和K-means加权聚类融合算法的基础上,结合实际数据的结构特点,根据聚类在不同阶段聚类对变量的敏感程度不同,建立了一种分阶段的K-means加权聚类融合的方法。该模型在加权聚类的权值不能准确量化的情况下,模型聚类效果较好。然后选取2016年1月1日至2016年12月31日的App的数据,对数据进行清洗变换,形成能够代表App价值的截面数据。再根据App数据的特点,利用相关性分析,选择出表现App的接触能力变量平均规模、复合增长率等变量。最后使用传统的K-means、K-means加权聚类和聚类融合的方法以及改进的分阶段聚类方法对App数据进行模拟,对其分类结构进行评价,从而得出改进的模型分类效果较好。然后根据分类结果提取出六大类型特征。最后根据六种特征提出它们的应用场景和进一步研究的方向的建议。
其他文献
<正> 医院除提高治疗效果外,同时应减少不合理的住院时间,以减少不必要的花费。最近提出一种标准,区分是不合理天数还是长期住留(LOS)。目前有两种方法监控不合理天数。对LOS
日前,《人民日报》刊文《生不出二孩真烦恼》,呼吁代孕合法化,引发热议。2月8日,国家卫计委发言人表态,"根据相关法律,继续严厉打击代孕行为"。放眼域外,商业代孕兹事体大,血缘
嘉宾档案$$陈德起,管理学博士,深圳国学院执行院长,深圳市中小企业发展研究会会长。主要著作有《中国式领导力修炼》《中国古代廉政史话》。《破解深圳发展的DNA》《深圳创新优
报纸
详细介绍了太钢不锈热轧厂设计开发的四辊轧机液压压下自动控制系统的组成、功能和应用效果。
采用实证研究方法,研究基于语料库的数据驱动词块习得模式的效果,通过语料库资源运用于词块习得的研究,探索如何充分发挥语料库数据驱动提高词块能力的方法,并让学生在实际运
2型糖尿病(T2DM)是一种多基因遗传性疾病,其病因及发病机制目前尚不十分清楚。一般认为,T2DM的发生是多源性的,是环境因素和遗传因素共同作用的结果。近年研究证实,胰岛β细胞功能
乳腺拥有将各种营养物质转化成乳成分的能力,因此乳腺上皮细胞被称为“生物工厂”。泌乳是乳腺的主要功能,当哺乳动物独有的泌乳能力被激活时,乳腺向新生代提供成长和发育所