论文部分内容阅读
随着大数据技术和人工智能技术的高速发展,网络结构作为一种常用的数据结构,用于描述现实世界中实体之间的复杂关系,在许多的领域中已经被大量的使用。常见的应用包括在网络数据上进行社区检测,节点分类,链路预测以及网络可视化等等任务。在工业界也有着大量的网络应用,例如在社交网络上进行诈骗账户的判断等等。但传统的网络数据分析方法大都是基于人工定义的网络特征。这类方法通常无法很好地适应各种下游的网络分析任务,同时有着较高的时间复杂度。而本文研究的网络表征方法就尝试解决此类问题。网络表征学习通过对网络中节点矢量化表征来反映节点及其拓扑特点,从而体现现实中事物之间存在或有可能存在的各种关系,针对性的解决不同网络中不同的网络分析任务。相对于传统网络数据分析方法,网络表征学习使得下游网络分析任务的性能能够有所提高,同时还能一定程度上降低复杂度。本文的工作主要集中在利用复杂网络中的高阶结构信息来改进目前的网络表征算法。目前大多数网络表征学习方法主要关注保持网络的社区结构特征,即如果两个节点在网络中距离较近,则它们在表征后的低维空间中的距离也接近。但网络中还存在结构等效性,也被称为节点角色,例如网络中某些节点之间相隔很远,但如果在网络中具有相似的连接形式,就可能有相似的功能。而大部分的网络表征算法对于这类特征没有能很好的保留。因此本文首先提出了一种同时融合了社区结构和结构等效性的网络表征方法。特别地,本文采用了一种基于高阶子图的graphlet度向量方法来描述网络中节点之间的结构等效性。随后本文分别在合成数据集和真实数据集中进行了大量的实验,评估了该融合网络表征方法在网络聚类,节点分类,以及可视化等任务上的性能表现。这些结果表明,网络分析任务通常不仅涉及到网络社区结构,也与节点之间的结构等效性有关;同时也说明此方法性能优于一些目前的最先进的方法。另外,现实世界网络中的节点通常附带着额外属性以及标签信息,但大部分网络表征方法只是利用了网络的结构信息,却无法很好地利用这些包含重要信息的节点属性和标签信息,同时也无法让表征学习算法根据下游网络分析任务进行针对性的训练。本文提出一种基于图卷积神经网络的网络表征方法,其能够同时利用网络结构信息和节点附带的属性信息。同时,基于图卷积神经网络的表征算法还能利用已知的节点表征进行端到端的监督学习,得到专门为下游任务优化的网络表征。进一步,目前的图神经网络方法受限于模型深度,无法获取网络中的高阶信息。本文加入了一种多通道高阶图卷积神经网络架构,通过增加输入的通道数量来获取网络中的高阶信息。本章也通过对比目前最新的网络表征方法,执行了大量的实验来验证提出架构的有效性和高效性。综上所述,本文主要在网络表征算法领域里做了两个方面的研究:(1)利用网络中高阶子图提出一种融合了社区结构和结构等效性的网络表征算法;(2)利用多通道高阶图卷积神经网络架构使得基于图卷积的网络表征算法能够获取到网络中的高阶信息。这些结果表明在网络表征学习的过程中融合高阶结构信息的重要性,这些高阶结构信息使网络表征学习能够更准确地表达原始网络中的结构特征,同时在网络分析任务上的性能进一步提高。