基于统计推理的复杂网络社区结构分析

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ssbbe1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现实世界中的许多复杂系统,如互联网、物联网、食物链网、神经网络以及社会网络等,都可以描述成由节点集通过边连接构成的复杂网络。社区发现作为复杂网络的一项重要研究内容吸引了多个领域的研究人员从不同视角对其进行深入研究。尽管近年来涌现出一大批新颖的社区发现方法,但依然存在许多问题,包括网络的重叠社区发现、异质网络的社区发现、网络社区的自动探索以及社区发现的应用等。  本文提出一系列基于统计推理的方法来进一步研究解决上述难题,研究内容主要包括重叠社区发现和社区自动探索两个方面。重叠社区发现主要针对符号网络和加权网络,其中符号网络考虑了边的正负极性,加权网络考虑了边的强弱程度;社区自动探索主要针对同质网络和异质网络,其中同质网络由单一类型节点和单一类型边组成,异质网络由多类型节点(如带属性节点)或多类型边(如多维度边)组成。具体内容包括:  第一,研究了基于混合模型的符号网络重叠社区发现。现有的符号网络社区发现方法都仅允许网络的节点属于一个社区,但真实世界中网络的节点可能同时属于多个社区(即重叠社区)。针对这个问题,本文提出了一种符号概率混合模型用于发现符号网络的重叠社区。它用混合模型同时描述正边和负边的生成过程,其中正边存在于社区内,负边存在于社区间。该模型不仅能发现符号网络的重叠节点,还能提供节点属于社区的隶属度信息。在大量的符号网络上的实验表明该模型能发现符号网络的重叠社区并取得较优的性能。  第二,研究了基于贝叶斯的加权网络重叠社区发现。现有的混合模型方法能比较好地发现加权网络的重叠社区,但在某些网络上会出现一些节点不属于任何社区,从而导致模型不能适用于网络。本文提出了一种贝叶斯混合网络模型用于加权网络的重叠社区发现。该模型通过为模型参数引入先验分布解决了上述问题。在人工合成网络和真实网络上的实验表明该模型能发现加权网络的重叠社区并取得较优的社区划分效果。  第三,研究了基于非参贝叶斯的网络社区自动探索。现有的社区发现方法要么需要预先假定网络的结构类型(如社团结构、多部图结构或混合结构等),要么需要预先指定网络的社区数目,但真实世界中许多网络的结构类型和社区数目都是未知的。针对这个问题,本文提出了一种贝叶斯非参混合模型用于自动探索网络的社区结构类型和社区数目。它将具有探索网络社区结构类型能力但需要预先指定社区数目的混合模型拓展到非参框架下,利用狄利克雷过程自动确定其社区数目。在大量的人工合成网络和真实网络上的实验表明该模型能自动探索网络的结构类型和社区数目并取得较优的社区划分效果。另外,基于该模型的好友推荐系统取得了很好的效果。  第四,研究了基于非参贝叶斯的异质网络社区自动探索。本文分别从带属性节点网络和多维度网络两方面研究了异质网络的社区自动探索。带属性节点网络社区自动探索的一个主要难点在于如何有效利用节点的属性信息来提高探索效果。本文提出了一种贝叶斯非参属性模型用于自动探索带属性节点网络的社区结构类型和社区数目。它通过共享变量的方式同时融合了节点的连接和属性信息。在真实和人工合成的带属性节点网络上的实验表明该模型能自动探索网络的结构类型和社区数目并取得较优的社区划分效果。现有的多维度网络社区发现方法的主要不足在于需要预先假定网络的结构类型(如社团结构等)。本文提出了一种多维度贝叶斯非参混合模型用于自动探索多维度网络的社区结构类型和社区数目。该模型先利用网络社区自动探索方法从每一维度抽取出结构特征信息,然后利用现有的聚类方法对融合后的结构特征进行聚类得到多维度网络的结构类型和社区数目。在真实和人工合成的多维度网络上的实验表明该模型能自动探索网络的结构类型和社区数目并取得较优的社区划分效果。
其他文献
随着网络技术的高速发展,网络服务在社会生活的各个领域发挥越来越重要的作用。网络技术、网络服务在带来了巨大便利的同时,也带来了前所未有的安全性威胁。密码学作为保证信息
作为Web2.0时代的重要元素,博客以极快的速度融入到人们的日常生活之中。博客能成为互联网上人与人之间重要的交流方式,与其读者可以方便、快捷地在博客上发表评论的特征是密不
自从Willsky在1976年发表第一篇故障诊断方面的综述文章后,故障诊断技术便蓬勃发展起来。随着嵌入式技术的不断成熟与发展,嵌入式控制系统已经越来越广泛地应用于工业生产的
随着统计自然语言处理的出现,在文本处理领域,我们需要将自然语言描述的文本转换为一种可计算的数据结构。如经常使用向量来表示一个词,向量在某个维度上的值表示了词在某一
随着Internet的迅猛发展,?络已经成为?个信息发布和消费的巨?平台。互联?具有快速传播和?泛覆盖的特性,对互联?舆情进?有效监控是必不可少的。由于?页固有的半结构性以及?量
可重构计算(Reconfiguration Computing)作为一种新型的体系结构和时空域信息处理模型,既具有接近于专用集成电路的高性能,又具有通用处理器的高灵活性,填补了传统软/硬件之
随着物流业的蓬勃发展,叉车的销量越来越大,电动叉车作为叉车家族的一份子,由于其节能环保、使用成本低、维护保养简单等特点,也受到了越来越多的关注。由永磁同步电机构成的交流
随着三维动画广告在电视屏幕上的频频播映,计算机动画已经悄无声息地走进了人们的日常生活。在计算机动画中的人体动画中,脸部表情动画(Facial expression animation)是最困
DNA微阵列技术是生物信息学中一项很重要的技术,它能够同时监控成千上万个基因的表达值。通过分析DNA微阵列的数据集,生物学家能够得到非常有用的信息用于基因预测和基因调控
计算机技术的发展使得医疗模式不再复杂,慢慢走向分子医疗和信息化医疗阶段:首先现代医疗模式利用分子生物技术、DNA测序技术对人体进行DNA测序,接下来将得到的结果与人类标