基于Apache Mahout的推荐算法的研究与实现

被引量 : 39次 | 上传用户:pikaqiuqqq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的迅猛发展,互联网成为了人们生活中不可或缺的一部分。人们对互联网的需求也不仅仅限于工作,他几乎出现在人们生活中的每一个角落。出门吃饭,可以通过日新月异的搜索引擎,可以按照推荐率自高而低排列。要看电影,也可以在各门户网站,电影网站,搜索到最新的评分及影评。但随之而来的是接入互联网的网页数量不断增长。传统的搜索算法只能呈现给所有用户同样的结果,无法针对不同用户提供相应的信息,随之产生了“信息过载”的问题。因此,个性化推荐技术应运而生。协同过滤推荐算法是当前推荐系统中应用最广泛的推荐算法,但是随着电子商务的规模不断扩大,协同过滤算法同样遇到了一些挑战,如冷启动问题、数据稀疏性等问题。本文针对协同过滤算法进行了深入的学习和研究,并阐述了相应的组合算法和针对协同过滤算法的改进算法,取得了理想的结果。本文的研究工作主要如下:1、针对推荐系统和推荐算法的现状进行了详细了解,重点研究了协同过滤推荐算法以及Apache Mahout中关于推荐算法的相关知识;对当前的主流推荐系统和推荐算法进行了介绍,并对各种推荐算法的优缺点进行了说明。2、对协同过滤推荐算法进行了详细的分析。该算法主要包括两类:分别是基于用户的协同过滤推荐算法(User-Based CF)和基于项目的协同过滤推荐算法(Item-Based CF),同时还重点研究和介绍了当前应用非常广泛的Slope One推荐算法,针对这三种算法的算法原理及步骤进行了详细的解析。3、组合推荐算法的设计与实现。此处为本文的主要创新点,本文设计了一种全新的组合推荐算法,该算法主要是将基于项目的协同过滤推荐算法和基于用户的协同过滤推荐算法进行组合,充分利用用户-项目评分数据集所包含的用户和项目的相关信息来进行推荐。4、应用Apache Mahout开源框架,使用MovieLens数据集和MAE评估标准,对传统的基于项目的协同过滤算法、基于用户的协同过滤算法以及Slope One算法进行了仿真实验,对计算相似度的三种方法进行效果对比,同时对本文所述的组合推荐算法进行仿真实验。对比了传统的协同过滤算法以及组合算法的实验效果,同时对实验结果进行了分析。
其他文献
随着我国城市建设脚步的不断加快,基础设施建设的不断完善,我国的建筑行业有了一个较快的发展,各种建筑工程施工现场随处可见。建筑工程在人类社会中具有重要作用,其工程的质
在种族隔离制度下,南非的黑人城市化随着工业化的开展而逐步推进。对于黑人城市化,白人统治集团内部先后有过多次争论。为保持白人在政治和经济上的优势,从种族主义的意识形
在美国、德国等制造强国相继实施“再工业化”、“工业4.0”等战略背景下,我国出台《中国制造2025》作为实施制造强国战略的行动纲领。新疆担负丝绸之路经济带核心区建设重要
针对城市边缘区居民安置中存在的问题,对长沙市某一安置小区的居民进行了问卷调查.根据调查结果分析了安置小区居民生活的变化、居住环境的变迁以及这些变化给居民生活带来的
伴随着无线局域网(WLAN)2.4GHz/5.2-5.8GHz标准和全球移动通信系统(GSM)900MHz/1800MHz等标准的发展,不同通信系统之间的干扰问题逐渐突出。为了减小这种干扰,亟需提高接收机射频前
目的:分析胃癌根治术后生存5年患者的中医证型分布状态,比较复发患者与未复发患者的证型差异,并探讨中医证型与临床相关因素之间的关系。为提高中医辨证分型的客观化与准确性,
肺隔离症(pulmonary sequestration,PS)是一种较少见的先天性肺组织发育畸形,是胚胎期肺发育过程中部分肺芽组织与支气管树分离产生的先天性肺发育异常。PS由Pryce DM于1946年
无人直升机拥有自主飞行的能力,因其低成本、高性能、易维护等优点,广泛用于军事和民用方面,同时也具有很高的科学研究价值。双目立体视觉是计算机视觉研究领域的一个重要分支,在
近年来,随着陆地资源的大量开发与利用,开发海洋资源,尤其是海洋微生物资源愈发受到人们的关注。由于海洋微生物特别的生存环境,形成了独特的群落结构、遗传特性及生理机制等,使海
音乐剧是在19世纪末20世纪初诞生的,到了20世纪20年代迅速在欧美国家兴起。随着中国改革开放政策的进一步实施和推动,20世纪80年代以后,音乐剧这一种全新的艺术形式从西方国家传