论文部分内容阅读
随着微博社交网络的流行,越来越多的用户喜欢使用微博获取信息和表达观点。然而,随着用户的不断增多,微博的信息量也在成倍增加,用户越来越难找到自己感兴趣的信息。通常,用户获取的信息主要来源于关注者发布的微博信息,因此为微博用户推荐其可能感兴趣的关注好友,既能保证其获取高质量的信息又能扩大其交际圈。因此,如何推荐高质量的关注好友,一直是微博个性化服务的热点之一。目前微博好友推荐方法中,现有的基于社交拓扑结构和基于微博内容混好的好友推荐算法,不能全面分析微博数据的多种特征及动态分析用户兴趣偏好。提出一种基于社交关系和时序主题的混合好友推荐算法解决这些问题。基于社交关系推荐模块,引入适用于微博好友推荐的基于排序的矩阵分解模型,提取微博数据中的性别、年龄、社交活动特征,将这些特征引入到矩阵分解模型,优化求解用户亲密度预测矩阵,计算用户社交相似度。基于时序主题推荐模块,按时间窗口把用户发布的微博内容分段,针对每一时段,把同一位用户的微博文本聚合成一个用户文档,利用潜在狄利特雷分布(Latent Dirichlet Allocation,LDA)模型提取用户-主题特征,并使用詹森香农(Jensen-Shannon,JS)距离计算兴趣相似度;根据历史各时段的兴趣相似度,使用时间衰减函数预测用户最终的兴趣相似度。在此基础上,线性融合社交和兴趣相似度,使用协同过滤算法进行Top-k好友推荐。在真实的新浪微博数据集上进行验证,改进的混合好友推荐算法具有较好的推荐效果,在平均准确率均值(Mean Average Precision,MAP)上优于已有混合好友推荐算法。