论文部分内容阅读
推荐系统旨在根据用户的历史行为数据、物品内容等,通过一定推荐算法,自动帮助用户筛选、过滤信息。自从上世纪九十年代推荐技术诞生以来,学术界已经对推荐系统的各个层面问题进行了深入研究,工业界也广泛应用了推荐技术的研究成果。但是目前推荐系统领域仍然存在不少难点问题。本文的研究重点是社交网络推荐,针对其中最重要的用户反馈建模、冷启动、数据稀疏性、评分预测精度、大规模推荐系统等问题进行了探索,提出了相应的可行解决方案。本文的工作概要如下: 针对用户反馈建模问题。不同于传统的直接使用用户操作过的物品的内容集合或者评分作为用户特征,本文提出使用改进的sigmoid函数映射的方法,从而使算法应用者能够更好地控制和评估用户建模的细节。 针对推荐系统中的冷启动和不活跃用户问题。这部分用户几乎没有直接可被利用的交互行为,因此,传统推荐系统很难为这部分用户做出合理的个性化推荐。本文提出利用手机通讯录匹配、社交网络帐户关联等方式,获取用户联系人或好友信息,构建局部社交网络,并利用局部社交网络数据为用户进行推荐。 针对推荐系统中的数据稀疏性问题。用户对物品的操作行为往往只占总物品数的很小比例,且一般集中在对用户喜欢的物品上。因此,如何丰富用户行为数据同时不引入过多的噪音是许多研究者关心的课题。本文提出使用社交圈子兴趣辅助的方法,使得可利用的数据量提升一倍以上。实验表明该过程基本没有引入噪音,且可以通过模型参数精确控制。 针对推荐系统中的评分计算精准度问题。推荐精准度是推荐系统最常用的度量指标之一。本文提出一种新的基于社交圈子矩阵分解的推荐算法,通过实验验证了该方法优于同类方法,且比经典方法提升达16.7%以上。 针对推荐系统中的大规模计算问题。现实中推荐系统通常需要处理亿级用户和物品,因此大规模推荐是推荐系统和算法设计必须考虑的问题。本文所有算法均在MapReduce框架上利用Hadoop集群实现,表明该方法具有良好的可拓展性。本文设计实现了一个应用于社交音乐推荐的大规模推荐系统。