基于结构和引力双内聚的动态微博社区研究

来源 :西华大学 | 被引量 : 0次 | 上传用户:dl612
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于人类社会的不断进步和互联网的快速发展,人们的日常生活和工作都离不开互联网。互联网为人们带来的便捷性使得人们可以直接通过互联网做很多日常生活中的事,如支付、购物、交朋友等。新浪微博、推特等社交网络平台已是人们互相交流、获取资料信息的重要途径。人们可以运用这些平台分享自己日常生活中的点滴,发表自己的观点等。由于社交网络平台使用者的日益增长,每天都会有海量的数据在平台产生,这使我们很自然地进入到大数据时代。如何利用海量的数据来解决我们日常生活中现存的问题是非常重要的。微博是一个开放的实时的在线社交网络平台,它是基于用户及用户关系的平台并允许人们发表日常生活中的事件、分享个人心情等。在大量的微博用户中,一些微博用户事实上具有相似的兴趣爱好。因此,将微博中具有相似兴趣爱好的微博用户聚集到一起具有非常重要的意义,如广告精准投放、好友推荐等。社区是指由一些节点组成的一个群体,社区发现则是探索这样一个具有特殊关系的群体。现有的社区发现方法都从社区结构角度进行分析。随着时间的变化,社区并不是固定不变的。因此,对社区演化的研究是必不可少的。现存的社区演化方法主要研究社区的“分裂”、“合并”、“缩小”等演化行为。对于微博社交网络,我们不仅可以从社区结构角度对社区进行分析,还可以从微博内容角度提取微博用户兴趣特征进行分析。而对于微博社区的演化,现存的一些社区演化方法只是分析了社区显式的演化行为,忽略了微博社区的隐式演化行为。基于现存的社区发现方法和社区演化方法的不足之处,本文提出了基于结构和引力双内聚的社区发现和演化算法。本研究工作的主要研究内容包含以下几点:1.根据带有时间序列的微博数据给出微博社交网络的相关定义,包括:静态微博社交网络的定义、动态微博社交网络的定义、微博社区的定义、社区演化的定义以及社区演化行为的定义等。利用自然语言处理技术在微博数据集上提取微博用户兴趣特征。重构复杂网络中的引力关系,结合提取的微博用户兴趣特征,构造微博社交网络中的引力关系。根据新定义的微博社交网络和微博社交网络中的引力关系构建微博社交网络图。2.采用随机游走方法结合博弈理论来发现微博用户引力倾向关系。在构建的微博社交网络图和发现的微博用户引力倾向关系的基础上,找出微博社交网络中的基本节点并提出微博社区发现算法来发现微博社交网络中的社区。3.在已发现的t时间点的社区基础上,利用t+1时间点的微博数据找出相邻时间序列微博社交网络的变化。根据t时间点发现的微博社区和相邻时间段里发生变化的微博用户及其关系提出微博社区演化算法来发现t+1时间点的社区。通过定义t时间点和t+1时间点社区之间的相互转化概率,提出微博社交演化行为提取算法来提取微博社交网络中社区的演化行为。4.进行实验对本文提出的算法进行对比评估。实验包括三个部分:微博社区发现算法的对比与评估、微博社区演化算法的对比与评估、算法中涉及到的参数的最优取值范围研究。实验中得出的结果用表和图进行表示,并对其进行分析。实验结果表明本文提出的算法在结构方面和其它基准方法都具有较好的性能,而在引力方面则具有更好的性能。
其他文献
随着类脑计算在学术界和产业的热度持续高升,研究生物智能与机器智能深度融合并协同工作的新型智能系统,是当前人工智能与脑认知科学交叉领域面临的重要课题。智能体技术源于
在医学领域中,医生常常对同一个病人在多种模式下的成像,或者在同一种模式下多次成像的结果进行配准,这个过程可归属于数学物理领域中的反问题,而反问题大部分是不适定的。自
随着互联网新型应用技术(如云计算、大数据、IoT、NFV等)的革命式演进,这波数字化转型催化了用户对海量资源信息(如视频、社交图像分享等)的获取需求,流量应用和网络服务也发
物体检测在图像识别与计算机视觉领域中是一个比较热门的研究方向,在诸多领域中,均有着广泛的用途。在自动驾驶领域,通过物体检测来合理的规避行人和车辆;在图像处理领域,图
思维导图作为一种图形工具,能够对学生的思维进行整体发散。因而在小学数学复习中应用思维导图的教学方式,可以在启发学生思维的过程中,加强学生对数学知识和问题的思考探索
包层集成采用多模块段(Multi-Module Segments,MSS)设计方案。为了满足包层模块能够正常运行与安装维护,本文在包层设计与遥操作维护(Remote Handling,RH)的基础之上,展开了对包层背板及背板支撑的结构设计与其相关性能的分析研究,从而验证了所设计的背板及支撑部件的安全性与可靠性,为后续包层集成设计的进一步优化与工程设计阶段提供基础依据。本文在水冷陶瓷包层(Water
机器人在家居环境下执行服务任务时,需要根据发出服务请求指令的服务对象来选择其专属物品进行任务的推理和规划,即执行个性化服务。但当前家庭服务机器人智能化程度较低,任
随着硬件描述性语言(Hardware Description Language,HDL)的高速发展,Verilog作为一种标准化的硬件描述性语言,被广泛地应用在数字电路和系统的设计上。同时,硬件描述性语言
目的:探讨艾灸改善血管性痴呆大鼠认知功能的作用机制。方法:实验共设正常组、假手术组、模型组、艾灸组、西药组。结果:与模型组比较,艾灸组大鼠逃避潜伏期缩短(P
近年来,随着科学技术的飞速发展,数据量的不断膨胀,如何有效地分析这些海量数据已经成为了目前研究的热点和难点。聚类分析方法发展至今,已被广泛应用于生物信息学、计算机视