论文部分内容阅读
随着Internet相关技术的不断提高与广泛应用,在线社交网络成为了人们分享信息的主要方式,微博作为社交网络中的重要信息交互平台,受到了大量用户的青睐。随着微博用户的增多,社交平台的用户数据呈指数级增长,相关系统应用也越来越多。用户的相似度计算是社交平台相关应用的一个重要基础,如社会化推荐,社区发现等,被众多的研究者关注。如何更准确地挖掘出微博社交网络中的相似用户,帮助平台为用户提供更好的服务,是当前研究的一个热点问题。本研究以此为目的,对微博用户进行了深入分析,提出了一种挖掘微博相似用户的方法。首先,本文针对微博用户影响力评估方法存在的问题,提出了一种微博重要用户挖掘算法,接着,对重要用户进行聚类,为用户生成兴趣表示,结合用户的背景信息,提出了一种融合兴趣的微博用户相似度计算方法。具体工作如下:(1)研究了微博用户的影响力分析,提出了一种改进Page Rank的微博重要用户挖掘方法。首先分析了用户的背景信息,为每个用户定义基本的自身影响力,针对用户一段时间不活跃,影响力被误判下降的问题,基于用户博文的交互信息,引入了博文传播率的计算方式,最后,基于用户的社交关系,通过改进Page Rank算法,构建了一种用户影响力评估算法,挖掘重要用户。实验结果表明该方法在准确率和召回率等方面都有提高,验证了提出方法的有效性。(2)研究了用户的兴趣表示,提出了一种融合兴趣的微博相似用户计算方法。分析了目前微博用户兴趣挖掘的一些研究,提出了基于微博关系网络的重要用户来间接获取用户兴趣的方法。为了丰富用户标签的向量化表示,使用Word2Vec来生成带有语义信息的低维词嵌入向量,对向量进行聚类,得到用户的兴趣表示,再结合用户的背景相似度,提出了基于用户兴趣和背景信息的综合相似计算模型,层次化的挖掘出微博相似用户。在实际的数据集上进行了实验,结果表明了提出算法的有效性。综上所述,本文分析了微博用户的相关特性,对用户的影响力评估,用户兴趣挖掘进行了深入的研究,最终提出了融合兴趣的微博相似用户挖掘方法。实验结果表明该方法挖掘微博相似用户具有良好的效果,这对用户推荐、社区发现以及影响力分析等领域都有重要作用。