基于R语言数据挖掘的社交网络客户细分研究

被引量 : 28次 | 上传用户:nimin518
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几年来随着web2.0的发展,社交网络(SNS)作为web2.0的有形载体也实现了巨大的成长。伴随社交网络发展壮大的,一方面是社交网络的用户群,不同地域、性格和特质的用户群展现出了差异化的需求;另一方面是大大小小的社交网站,他们如雨后春笋般出现,开辟了硝烟弥漫的网络战场。面对差异化的用户群体和用户需求,如何细分市场识别并提供差异化的服务,以帮助企业在激烈的竞争中保持老用户,发展新用户,这是本文的主要论题。本文围绕社交网络理论和客户细分理论的研究,运用数据挖掘工具中的聚类和决策树算法,对社交网络的客户细分进行了深入的探讨并最终得出可指导实践的社交网络客户细分规则。本文的研究主要分为理论研究和实证研究两大方面。在理论研究方面,通过对社交网络理论和客户细分理论的研究,本文在第二章里综合两个理论,阐述了细分方法和细分变量的选取;并在第三章的数据挖掘技术中,介绍了数据挖掘中的聚类和决策树算法,在比较相关的算法优劣的基础上,确立了算法和模型的选择。基于理论研究方面的结论,在实证研究方面,本文选取了R语言作为研究工具。首先利用第二章确立的细分变量,选择JAVA开发爬虫程序从人人网中抓取数据;之后,采用了DIANA算法对抽样样本计算,得出可划分的簇数目;在此基础上进一步利用PAM算法对整体样本进行精确计算,得出了4大聚类,并引用了波士顿矩阵赋以名称和意义;最后,运用了决策树中CART算法和C4.5算法对决策树规则进行了探索,得出相应的树和规则以指导实践。
其他文献
随着我国加入WTO和金融市场的进一步开放,银行业必然面临着来自外资银行的激烈竞争。更为重要的是我国银行业在剥去行业垄断和政府保护的外壳后,所拥有的优势几乎荡然无存。
随着书籍出版产业从工业时代的传统出版业发展到电子时代的个性化发行,整个出版产业链发生了巨大的变化,出版门槛低、市场反馈准、交易成本低。电子阅读越来越被人们所接受。
本文的办公大楼火灾模型是基于火灾动力学模型(FDS)建立起的计算模型。利用火灾建模软件pyrosim建立火灾建筑模型,并导入FDS进行数值模拟,并在计算过程中获得各楼层相对准确
急诊护士情景模拟训练是通过将输液场景、抢救场景、纠纷现场等现实的工作场景形象地展现在护士面前,预先设置矛盾和意外,由护士扮演各种角色,分别对新入科护士、工作2~3年护
随着通信技术的发展,通信网络正在逐步实现数字化、综合化、智能化,所以对通信系统的分析研究将会对现网使用和网络优化方面产生重要的意义。网络优化贯穿于整个网络建设,网
指纹识别技术自19世纪进入科学研究领域以来,已发展成为一项较为成熟、应用广泛的生物识别技术。与此同时,指纹识别技术仍然面临挑战。一方面,在实际应用中,仍存在大约10%的
目的 研究脑脊液免疫球蛋白和寡克隆区带检测在小儿病毒性脑炎诊断中的临床意义。方法 选取2014年6月~2015年6月于福州儿童医院住院治疗的40例患儿为研究对象,分为病毒性脑炎
汉语的口语词和书面语词差异大。这不仅是语体、语用的差异,而且也是汉语两大造词系统的差异。它们共同构成了汉语词汇鲜活而丰富的洪流。从理论上区分口语词、书面语词对解
在青少年成长的过程中 ,既要重视智力的培养和教育 ,更要重视意志品质等非智力因素对一个人成功与否的影响。在培养青少年掌握基本知识、基本技能的同时 ,培养他们形成良好的
研究背景:随着医药卫生科技的不断发展,药品安全性研究日益受到国内外药物研究领域的重视。近年来发生的一系列药品安全性事件,严重威胁着人类的健康。据世界卫生组织统计,因