基于网络用户行为分析的网络电视节目推荐系统

来源 :湖南大学 | 被引量 : 0次 | 上传用户:yanghaibin123
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
飞速发展的互联网技术极大的改变了人们的生活习惯。从前人们只能在家通过电视收看固定的电视节目,而现在可以通过手机,在任何一个视频浏览平台上找到自己想要看的视频或者是节目。从前人们只能再固定的场所使用电脑进行网络访问,而现在人们已经可以在任何地方使用各种各样的设备进行网络访问。这种转变使人们的生活更加便利,同时也产生了海量的用户网络行为数据。以前传统的数据处理模式无法处理海量数据,而随着云计算等技术的发展,使得对海量数据进行存储、处理成为可能。海量的用户行为数据看似杂乱且不相关,但随着商业智能系统和数据挖掘技术的发展,对这些数据进行剖析挖掘后,能对企业决策产生重要的影响。对于网络电视平台来说,可以利用这些数据分析后的结果,对特定的用户群体结合当前网络环境智能推送他们感兴趣的节目,这样能增强用户粘度,提高平台商业价值。本文以商业智能系统为背景,搭建一套BILOG系统。该系统能够收集用户网络行为,并且以LOG日志的形式存储在分布式数据库中。系统通过ETL(Extract Transform Load)对数据进行预处理,将收集的日志数据拆分成表,以便查询和计算。而后本文在Hadoop环境中使用MapReduce对用户基础数据进行清洗与生成,设定12个基础维度,并将每个维度的数据向量化,最终生成维度数据保存为csv格式用于聚类分析。本文预设10个类别,使用Weka软件作为平台,K-Means算法实现聚类分析。通过聚类结果可以发现,按照自动分配的质心和我们所划分的10个类,在最终的聚类结果中,每一类人群都有一些显著的特征,可以用来表征这一类人的兴趣爱好和行为习惯。通过对用户群体的兴趣概括提取并进行相应的界面展示和相关栏目推荐,可以达到增强用户体验,增加用户流量等目的,从而将数据价值转化为商业价值。本文研究重点在商业智能系统搭建以及数据挖掘算法实现个性化推荐,故本文不对数据采集做表述,本文中使用的数据为天池开源的微博用户数据,微博是当前活跃用户数最大的社交平台,且用户能够有点赞、评论、关注等一系列用户行为,通过这些用户行为的分析能够对用户进行分类。最后本文用特定的微博用户进行测试,在分好的10个类中各自有着明显的特征差异,表明用户分类基本准确。各类人群中都可以提取出相应的不同的兴趣爱好,通过相关栏目特征进行匹配,从而达到推送的目的。
其他文献
随着国际化社会经济的不断发展,现代港口综合物流中心也在不断进行规划与建设,目前的现代港口物流中心已经开始向综合国际经济、贸易物流化方向发展,实现了现代港口综合物流
处方:百合9克,生葱连须三株,冬瓜糖(亦名冬瓜条,市售)30克,豆腐3块(约5×5×1厘米)。用法:先将豆腐放入杯内,再将冬瓜糖插在豆腐上,然后把三株葱圈在杯内,加入百合,加水 Pr
需求市场的饱和与产出市场的过度拥挤和竞争,是集群进入成熟期之后经常出现的现象.从大唐袜业产业集群的成功经验来看,产业集群的外向型发展是延续浙江产业集群生命周期的一
目的对CAD合并小血管病变患者应用BP-SES治疗,并分析其对患者长期临床预后的影响。方法选取2017年10月~2019年9月,在我院治疗的30例CAD患者,根据其是否合并小血管病变,将其分
目的探析冠心病慢性心力衰竭患者心律失常临床治疗方案。方法选取来我院就诊治疗的冠心病慢性心力衰竭并发心律失常患者作为本次研究目标,抽选66例按照随机法分组,33例对照组
鸡球虫病是由艾美耳属各种球虫引起的鸡肠道粘膜产生严重病变的寄生虫病,严重危害了养禽业的发展。该病普及世界各地,轻者可导致鸡只生长发育不良,饲料利用能力下降,饲养周期延长
目的探究不同臂丛神经阻滞的麻醉效果。方法选取2017年6月~2019年6月上肢手术病人100例,随机分为对照组(传统臂丛神经阻滞麻醉)与观察组(超声引导定位)各50例,对比VAS评分、
目的分析运动疗法对脑卒中偏瘫患者肢体功能恢复的临床作用。方法选取我院收治的90例脑卒中偏瘫患者为研究对象,随机将其分为A、B两组,其中,A组为对照组,采用药物疗法,B组为
以2014年南四湖生态应急调水为例,综合运用气象、水文、调水水量、遥感影像、水位面积关系等多源数据资料,建立多源数据协同应用与分析方法,借助遥感影像技术,提取生态应急调
ue*M#’#dkB4##8#”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:(100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技