论文部分内容阅读
近年来随着移动设备的普及和移动互联网的发展,随之也带来了全新的用户习惯和消费模式。各类移动应用已获得越来越多用户的强烈推崇,移动终端俨然成了用户的私人助手,可以预期移动化、智能化已是未来互联网发展的趋势。移动应用的逐渐丰富和网络技术的迅速发展,使人们的生活更加的方便多彩,但同时也给人们带来了信息过载的问题。虽然分类目录和搜索这类大众化的服务在很大程度上提升了获取信息的效率,但其单一的呈现将用户注意力分散,降低了体验。随着技术的发展,推荐系统已成为解决信息超载问题最重要的过滤工具,它会根据用户兴趣特点和行为模式,更加智能和主动地帮助用户在海量的数据中快速高效地找到有价值的内容。当前推荐系统应用最成熟的是协同过滤推荐算法,然而面对移动设备的处理能力和海量数据的挑战,协同过滤算法也遇到了不小的问题,如冷启动、数据稀疏性、扩展性等。本文针对智能终端设备,把推荐系统搭建在云平台上,通过算法和大数据帮助用户快速找到感兴趣的饮食和运动,减少浏览大量无关信息,满足更加个性化的需求。为了实现对饮食和运动的个性化推荐,本文构建一个基于云计算平台的协同过滤推荐引擎,通过搭建在云平台上的后台服务器集群处理得到因人而异的建议信息,用户进入应用或刷新时显示到用户的移动终端上。以下是该系统设计和实现过程中的一些总结和成果:1.为了支持算法扩展和数据扩容,提出了基于开源平台Hadoop搭建推荐引擎,重点学习了分布式文件系统HDFS和分布式计算框架Map Reduce,并研究了利用云计算解决数据挖掘问题的Mahout算法库。2.为了推荐的准确性,运用组合多种推荐引擎的方式对用户进行推荐,应用多种不同的算法计算相似性,利用各自的优点而取得好的效果。最后,推荐引擎可以使用相似性信息根据请求参数进行推荐提高推荐准确性,进而提高用户满意度。3.根据推荐的实时性,分离在线计算和离线计算,然后再进行组合而快速计算出结果,将Top-N的结果返回给接口。接口是IOS设备与推荐引擎的链接纽带,论文设计推荐系统(服务器)与客户端(IOS设备)通过XMLRPC调用RPC Server的数据库存取方法,互相传递数据。本论文围绕为智能终端搭建推荐引擎平台方案为目标,提出了基于云计算平台Hadoop和Mahout的推荐引擎平台的架构模型,通过在Hadoop平台上运行多个推荐引擎,选取三个指标和Movie Lens作为数据集进行实验,对整个系统进行综合的观察和测评,在测试的实验中,准确的推荐结果证明了系统的可行性。