论文部分内容阅读
链接预测是复杂网络研究的重要方向之一,其旨在利用网络中的已知结构等信息预测网络中的未知结构信息。链接预测在推荐系统,犯罪网络,社区发现,商业决策等领域都有很重要的应用。目前,基于相似性的链接预测算法是主流的研究方向之一,该类算法认为网络中的节点之间相似程度越高,越趋向于链接。基于相似性的链接预测算法拥有低复杂度以及较高预测精确度的优点,这些优点使这类算法非常适合大规模网络的链接预测。根据利用信息的不同,基于相似性的链接预测算法可分为基于节点属性信息和基于网络拓扑结构信息两种,由于网络中节点的属性信息不易获得,使得基于网络拓扑结构信息的链接预测算法成为研究热点。传统的基于网络拓扑结构信息的链接预测算法大多只关心被预测节点对的邻居节点或者它们的共有邻居节点,而没有把被预测节点对的局部结构信息看做一个整体对待,从而忽略了很多有价值的信息。本文通过对已有算法的分析,结合复杂网络的强的社区结构特性的思想,提出小社区指标(Small Community index,SC),把被预测节点对和它们的共有邻居节点组成的小团体看做一个小的社区,认为小社区内的联系要更加重要一些。并且在SC的基础上,根据真实网络的实验结果确定了小社区内所需寻找的最大路径的长度,在保持精确度的同时大大降低了时间复杂度。近年来,随着学者们对复杂网络的深入钻研,发现有向和加权网络能更加全面的描述真实网络,很多研究已经证实了有向和加权网络的合理性,因此对于链接预测的研究不应仅仅考虑网络中链接的存在性,要根据复杂网络的不同,构建不同的网络,充分利用网络中链接的属性,提高链接预测的精度,扩展链接预测的理论与应用。在此基础上,本文对局部路径指标和SC进行了加权扩展,使它们可以充分利用加权网络中链接的权值信息;对共有邻居指标、资源分配指标、局部路径指标和SC进行了有向扩展和有向加权扩展。最后,本文对这些相似度指标在相应的真实网络中进行了测试,结果显示扩展后的指标均取得了很好的预测结果。