融合兴趣的微博相似用户挖掘研究

来源 :重庆理工大学 | 被引量 : 0次 | 上传用户:livebody
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet相关技术的不断提高与广泛应用,在线社交网络成为了人们分享信息的主要方式,微博作为社交网络中的重要信息交互平台,受到了大量用户的青睐。随着微博用户的增多,社交平台的用户数据呈指数级增长,相关系统应用也越来越多。用户的相似度计算是社交平台相关应用的一个重要基础,如社会化推荐,社区发现等,被众多的研究者关注。如何更准确地挖掘出微博社交网络中的相似用户,帮助平台为用户提供更好的服务,是当前研究的一个热点问题。本研究以此为目的,对微博用户进行了深入分析,提出了一种挖掘微博相似用户的方法。首先,本文针对微博用户影响力评估方法存在的问题,提出了一种微博重要用户挖掘算法,接着,对重要用户进行聚类,为用户生成兴趣表示,结合用户的背景信息,提出了一种融合兴趣的微博用户相似度计算方法。具体工作如下:(1)研究了微博用户的影响力分析,提出了一种改进Page Rank的微博重要用户挖掘方法。首先分析了用户的背景信息,为每个用户定义基本的自身影响力,针对用户一段时间不活跃,影响力被误判下降的问题,基于用户博文的交互信息,引入了博文传播率的计算方式,最后,基于用户的社交关系,通过改进Page Rank算法,构建了一种用户影响力评估算法,挖掘重要用户。实验结果表明该方法在准确率和召回率等方面都有提高,验证了提出方法的有效性。(2)研究了用户的兴趣表示,提出了一种融合兴趣的微博相似用户计算方法。分析了目前微博用户兴趣挖掘的一些研究,提出了基于微博关系网络的重要用户来间接获取用户兴趣的方法。为了丰富用户标签的向量化表示,使用Word2Vec来生成带有语义信息的低维词嵌入向量,对向量进行聚类,得到用户的兴趣表示,再结合用户的背景相似度,提出了基于用户兴趣和背景信息的综合相似计算模型,层次化的挖掘出微博相似用户。在实际的数据集上进行了实验,结果表明了提出算法的有效性。综上所述,本文分析了微博用户的相关特性,对用户的影响力评估,用户兴趣挖掘进行了深入的研究,最终提出了融合兴趣的微博相似用户挖掘方法。实验结果表明该方法挖掘微博相似用户具有良好的效果,这对用户推荐、社区发现以及影响力分析等领域都有重要作用。
其他文献
针对雷达干扰识别决策树分类器设计需要人工介入的问题,提出了一种基于模糊聚类、Xie-Beni指标和信息增益的决策树自动化设计方法。该方法首先对干扰信号在时域、频域和脉压
党的十九大报告明确指出,在全面建成小康社会的决胜期,要坚定实施乡村振兴等发展战略。这就意味着大量资源向村落聚集,培养出一批正在迅速转型的“振兴村落”。乡村社会细微
为贯彻落实《政务信息资源共享管理暂行办法》(国发[2016]51号)、《政务信息系统整合共享实施方案》(国办发[2017]39号)等文件精神,进一步加快推进政务信息系统整合共享工作,
目的探讨黄连解毒汤联合盐酸多奈哌齐片治疗阿尔茨海默病(心肝火旺型)的临床疗效,了解中西医结合治疗的疗效是否优于单纯中药或西药,探索中西医结合的治疗AD的方案,同时也为A
星云大师人间佛教思想及实践是人间佛教思想的重要组成部分,更是人间佛教影响最为深远、最容易让民众接受和最具现世生命思考的重要部分。同时,星云大师的人间佛教是中国汉传
低出生体重儿发生是反应孕期质量、孕妇、胎儿及新生儿营养状况的重要指标.也是社会发展的重要指标.步入新世纪,妇幼保健工作走向纵深.要提高胎儿及新生儿的健康,应从妊娠前
摘 要:东西方文化差异导致了英汉两种语言的不同。本文从英汉语序差异、英汉被动句差异、英汉时态差异和英汉句子结构差异等四个方面进行论述,分析以汉语为母语的人在写作中出现Chinglish的原因。  关键词:英汉差异;Chinglish;英语学习  不同文化背景的人具有不同的語言表达习惯。东西方的文化差异导致了以汉语为母语的中国学生在写作中时常出现Chinglish现象。了解英汉两种语言在表达方面的差
目的:通过对耳穴降压沟进行电刺激,观察对原发性高血压患者中心动脉压的影响情况,分析耳穴电刺激降压沟对原发性高血压患者的即时降压效果,为临床开展耳穴疗法治疗高血压提供