论文部分内容阅读
随着Web2.0技术的蓬勃发展,全球逐渐迎来了社交网络(Social Network Services)时代,一些具有代表性的社交网站已成为影响力巨大的信息平台,如:Facebook, Twitter, MySpace和Flickr等。它们将用户群体和信息结合在一起,使用户可以便捷地分享和获取信息,同时也极大地拓展了用户的社交群体。用户的好友关系群体作为社交网站的可靠信息传播途径之一,是社交网站的一个很重要组成部分。在社交网络时代,许多用户把线下关系转移到线上关系,甚至产生与线下无关的单纯线上好友关系。好友推荐功能作为社交网络中非常流行且实用的个性化服务,有助于用户(特别是新用户)能更快地建立良好的好友关系圈,融入社交网络的信息服务当中。目前社交网络中好友推荐功能的方法有很多种,大多数都是基于社交网站的拓扑结构和用户个人资料实现,然而这些都是静态信息,不具备时效性。因此,首先对于SNS中的老用户来说,本文采用了基于用户兴趣圈子的好友推荐方法,主要包括兴趣圈子硬划分和软划分两种。鉴于硬划分方法将使用户仅归属于一个兴趣圈内,这将导致仅会推荐一个兴趣圈内的用户给他/她,而忽略了该用户的其它兴趣爱好信息,于是本文采用一种基于模糊谱聚类算法来解决兴趣圈子硬划分问题,并使用GKA算法保证它的全局划分效果以提高好友推荐的效率,详细介绍了模糊谱聚类算法的设计思想和设计流程。文中使用用户标注资源的标签作为用户特征,对获取到的标签信息进行数据清理及建模工作,将此作为本文的实验数据;并对谱聚类算法的尺度指数进行了改造,该值默认是需要手动设定,文中采用了一种自动设定方法,降低了该参数取值的随机性。然后详细描述了基于谱聚类以及模糊谱聚类算法的好友推荐实现过程,通过查全率和查准率两个指标,对模糊谱聚类算法和谱聚类算法进行试验验证了算法的优劣。其次针对新用户冷启动问题,也即如何为新用户进行好友推荐问题,本文设计了基于用户数据导入的方法,即访问用户在其它产品中的有关信息来为当前产品做好友推荐,该方法非常适合在企业中使用。最后本文通过LDAP配置、OAuth认证和访问用户的电子邮件信息为实例介绍了该方法的整个实现过程并且验证了该方法的有效性。