论文部分内容阅读
随着互联网的快速发展,网络上的信息也急剧增长,我们很难快速准确地获取有用的信息。因此,我们急需一种信息过滤技术来找出我们想要的内容。面对信息过载问题,推荐系统经过不断的完善与发展,已经越来越受到人们的关注。本文针对在线网络中不同类型的应用,提出了一系列有针对性的推荐算法,主要的研究成果和创新点在以下几个方面:(1)提出了基于加权的社交网络和物品关系的方法。在推荐系统中,协同过滤是最流行的方法之一,该方法利用了用户的历史行为数据来进行推荐。虽然协同过滤已被广泛运用,但仍没有很好的解决诸如冷启动用户等问题。随着社交网络的兴起,一些基于社交的方法也慢慢受到大家的重视。这些方法都基于一个假设,那就是在社交网络中,用户的爱好很容易受到其信任朋友的影响。但是这些基于社交网络的方法并没有区分对待不同朋友,而在现实生活中,我们更愿意相信亲密朋友的意见。基于加权的社交网络和物品关系的方法可以有效的解决上述问题。在基于社交网络算法的基础上,我们不仅考虑了信任朋友的影响,还对不同的信任朋友赋予不同的值,其权值由用户之间的相似度来代替。另外,由于被同一个用户所喜欢的物品通常具有一定的相似性,因此我们还考虑了物品之间的关系。由于冷启动用户不仅行为较少,而且信任关系也很少,因此利用物品之间的关系也可以缓解冷启动用户问题。在实验中,我们利用Epinions数据集来对模型进行验证。从结果中可以看出本文的模型比其他方法在不同的设置上都要好,尤其是对于冷启动用户。(2)提出了基于频繁N元概念的方法。在社交网络中,许多用户都会通过给物品评分或者建立标签来达到分享的目的。因此,在用户、物品、评分、标签以及其他数据中存在一些隐藏的语义关系。以前大多数的工作只集中在<users, items, ratings>或者<users, items, tags>等三元关系上,但三元关系是远远不够的,其丢失了许多重要的信息,不能提供准确的推荐结果。基于频繁N元概念的方法充分利用了不同的数据,挖掘出其中隐藏的语义关系。如果有标签数据,我们把用户行为组成一个四元组<users, items, ratings, tags>;如果没有标签数据,我们联合上下文信息和用户特征,组成一个五元组<users, items, ratings, contexts, features>。在实验中,我们利用MovieLens数据集来对模型进行验证,从结果中可以看出本模型比其他方法在准确率上要好得多。