论文部分内容阅读
链接预测作为社会网络分析的研究热点之一,目的是预测网络中缺失的链接或将来可能产生的链接。链接预测在生物网络分析、社交网络推荐、交通网络规划等方面有广泛的应用及理论价值。目前,大多数链接预测指标是根据网络的拓扑结构定义的,该类指标的构造较为简单,一方面没有考虑网络的社区结构特征,另一方面没有将多个网络结构特征进行结合。基于此,本文从以下三个方面研究网络的链接预测问题。 第一,针对链接预测信息理论模型中邻居集信息指标没有考虑真实网络的节点度和社区信息,本文将节点度函数引入邻居集信息指标提升链接预测,进一步将网络社区结构信息引入到两节点连接的先验概率中,基于属于同一社区的两个节点连接的概率大于属于不同社区的假设,得到基于节点度和社区结构的邻居集信息指标。在真实网络上的实验结果表明,基于节点度和社区结构的邻居集信息指标预测精确性更高。 第二,朴素贝叶斯模型考虑了网络的共同邻居特征,但是邻居集间的连边也是网络的一个重要特征,因此可以用来提升链接预测的表现。本文利用朴素贝叶斯模型将共同邻居和邻居集间的连边这两个特征相结合,得到邻居集朴素贝叶斯链接预测模型。此外,本文引入邻居节点的社区信息,提出基于节点社区的邻居集朴素贝叶斯模型。与局部朴素贝叶斯模型相比,本文的方法预测表现有较大提升。 第三,随着社会发展,网络数据的规模越来越大,研究者提出了大量关于链接预测的方法。给定一个网络,如何快速地选择合适的链接预测方法是一个亟待解决的问题。本文以链接预测指标的精确性为响应变量对网络拓扑结构特征进行变量选择,得到影响链接预测指标精确性的主要因素。进而结合分类树给出一套基于网络拓扑结构特征推荐链接预测指标的准则。