论文部分内容阅读
随着互联网技术的迅猛发展,博客、微博等社交网络应用已经成为人们获取资讯的重要途径。社交网络具有自由性、开放性、灵活性等特点。一方面社交网络促进了信息的流通,另一方面也引发了谣言、隐私安全等诸多社会问题。因此能够快速准确的定位社交网络上的信息源,对于舆论控制等具有重要意义。与传统的信息传播方式不同,在社交网络上,信息在用户间传播的过程中,用户会根据兴趣及其他因素转发信息。转发操作前信息内容会记录其信息来源,然后用户将其作为一条新的信息传播下去。因此在社交网络信息传播过程中,用户往往会获取信息的部分传播路径。社交网络上的源点定位,一种有效的方法是通过在网络上部署观察点,根据观察点记录的传播信息来估计网络中的信息源点。本文在原算法基础上,基于复杂网络相关理论,完成了以下两方面工作。首先,研究了社交网络的传播特征,发现社交网络信息普遍具有记录部分传播路径的特点。利用这一特征,本文在现有源点定位算法的基础上提出了一种基于部分传播路径的源点定位方法。以观察点记录的部分传播路径为基础,对以候选源点为根构建的传播生成树进行优化,目的是得到能够更加真实反映信息传播过程的广度优先生成树,进而提高算法的定位准确性。其次,现有源点定位算法的时间复杂度为O(N3),在大规模网络上其定位效率难以接受。现有源点定位算法计算成本较高的原因之一,是需要对每个候选源点进行极大似然估计值计算。针对此问题本文提出了一种基于部分传播路径的候选源点筛选算法,通过分析信息传播过程的规律,得到信息传播过程中真实信息源与传播路径之间的关系。然后结合观察点记录的部分传播路径,对候选源点集合进行有效的筛选,排除无法满足记录路径的候选源点,目的是减少候选源点数量,进而降低算法时间成本。在多个模型网络以及实际网络上对改进算法进行实验,并对实验结果进行分析,充分验证了本文提出算法的有效性。