论文部分内容阅读
随着互联网和信息技术的飞跃发展,作为信息过滤的一项重要解决方案,个性化推荐技术得到了广泛的研究与应用,各大互联网网站纷纷提供了个性化推荐服务以提高网站的核心竞争力。尽管协同过滤推荐算法在推荐系统中广泛应用并且获得了巨大的成功,但随着互联网的发展,网络资源信息越来越庞大,网络用户人数越来越多,协同过滤的发展也面临着巨大挑战,比如数据稀疏、冷启动等问题。近几年,随着以FaceBook、微博、微信为代表的社交媒体的流行,给个性化推荐研究提供了新的思路,通过分析和挖掘用户在社交网络中的海量信息和行为以及社交关系,可以知道用户的兴趣爱好,进而为用户提供更加准确的个性化服务。为缓解数据稀疏造成的推荐质量低的问题,本文将用户社交网络关系融入了协同过滤推荐算法中,来提高推荐的准确度。本文的具体研究工作如下:(1)重点研究了协同过滤算法,分析了协同过滤技术目前存在的问题,针对数据稀疏性问题,提出了一种组合推荐算法。算法的思想是将Slope One算法和基于用户的协同过滤算法技术通过叠加的方式结合起来,利用Slope One简单、高效、准确度高的优点来对评分矩阵进行填充,缓解数据稀疏性问题,最后给出了算法的具体实现过程。(2)分析了目前比较经典的几种相似度算法的原理与缺点。针对不足之处,分析了社交网络信息对推荐的意义,然后综合利用用户的个人偏好信息和社交网络关系特征做出推荐。通过将用户个人偏好信息计算的用户相似度和利用社交网络关系计算的用户相似度进行线性加权融合,不仅可以提高推荐质量,也可以增加推荐系统的可信度。为进一步提升准确度,利用基于共同评分项数目的因子对融合后的相似度模型进行修正,基于此相似度模型给出了融合社交信息的协同过滤推荐算法的推荐过程。(3)在Mahout上进行了算法的实现。并利用Movielens数据集和百度推荐大赛数据集进行实验分析与验证,并与传统的协同过滤算法进行对比,验证改进方案的可行性。