论文部分内容阅读
得益于Web 2.0技术的发展与普及,科研社交网络吸引着大量学者的加入。学者在网络中分享研究成果、参与话题讨论、创建研究小组,有效提高了科研效率。科研社交网络中的学术资源呈现爆发式增长,出现了“信息过载”问题。信息过载限制了科研人员的信息搜索能力,如何在海量学术资源中寻找满意的合作学者,已成为科研社交网络亟需解决的问题。推荐系统能够向用户提供建议和推荐项目,为用户决策提供辅助,是解决信息过载问题的有效途径。因此,将推荐系统应用到科研社交网络中,建立有效的推荐机制对科研社交网络的发展非常重要。现有科研社交网络的推荐方法大多针对论文推荐,忽视了用户寻求合作学者的行为。而且已有的学者推荐方法主要依据用户社会关系或学者兴趣,鲜有综合学者偏好和社会关系两个角度提供学者推荐的方法。用户画像可以精准定位学者偏好,分析学者间的交互行为。合作关系反映了学者历史合作的强度,以合作关系为边,以合作强度为权重可以将学者紧密联系在一起。为此,本文结合用户的社会化信息,从科研人员用户画像和合作关系两个维度构建学者推荐模型。首先,根据学者发表的论文数量及期刊级别评估其科研能力,将学者发表论文的标题、摘要、关键字作为输入,使用TF-IDF和LDA主题模型全面分析学者的主题相似性,结合社交网络上的有用信息构建用户画像。然后,在考虑合作关系传递特性的基础上,根据历史合作关系网络分析学者间合作质量,计算学者间的合作强度,进而综合以上三个方面的推荐值实现合作学者推荐。最后,为验证本文所构建方法的有效性,在真实数据集上进行了对比实验。结果表明,在准确率、召回率和F1值三项评价指标上,本文算法与基于用户的协同过滤算法(UCF)相比分别提升了54.2%、55.5%和54.5%,与基于词嵌入的推荐算法(Word2Vec)相比分别提升了89.73%、84.61%和84.56%,与基于信任关系的推荐算法(MoleTrust)相比,在Top-10内分别提升了3.33%、26.82%和24.02%。从而,验证了基于用户画像和合作关系的学者推荐方法的可行性和有效性,为协助科研人员更准确的寻找合作伙伴提供了新思路。