基于非负矩阵分解的链路预测算法及其应用研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:kyzy0082
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
链路预测是研究复杂网络缺失链接的预测与还原最有效的工具。链路预测目标是通过已知网络节点或结构信息(如节点属性,节点聚类,链接权重,局部和全局结构信息等)去预测网络中尚未形成连边的两个节点间产生链接的可能性。链路预测包括三个方面:首先,它可预测网络中的缺失链接;其次,它可分析网络演化即预测网络中未来可能出现的链接;最后,它可鉴定虚假链接以及消除随机噪音。因此,链路预测不仅具有重大的理论价值还有广泛的应用价值。过去的十年,大量基于不同理论的链路预测算法被提出来在不同类型网络上执行链路预测任务并取得较好性能。然而,链路预测依然遭遇以下几个方面的挑战:首先,真实世界无向无权网络数据总是遭遇到高维度的,不完整的,虚假链接以及随机噪声的挑战,而现存方法无法同时处理这些问题;其次,大部分现存加权网络链路预测方法在仅考虑链接权重的强弱关系而忽略网络加权拓扑结构信息;此外,现存有向网络链路预测算法仅考虑链接方向强弱信息而忽略局部和全局的拓扑结构信息;最后,真实世界网络潜在结构总是复杂的如多层次性,而当前大部分现有方法仅考虑网络的浅层结构信息。基于上述分析,本文通过基于非负矩阵分解及扩展框架分别提出相关方法解决上述问题。本文主要研究内容为:首先,在无向无权网络中,现有的方法无法同时处理高维的、稀疏性、虚假链接和随机噪声等问题,提出了一个基于图正化与稀疏学习的鲁棒非负矩阵分解的链路预测模型。该分别通过热核函数和k-medoids算法去计算局部相似度和全局聚类信息。然后,分别将邻接矩阵和局部相似度矩阵通过鲁棒非负矩阵分解映射到低维潜在空间,并运用?2,1范数约束因子矩阵去识别虚假链接。在10个真实无向无权网络上分别与基于局部相似度,基于非负矩阵分解预测算法和网络嵌入方法进行比较,结果表明,该模型分别在预测缺失链接,识别虚假链接,消除随机噪声和鲁棒性等四个方面上的性能获得显著的改善。其次,权重链接和网络拓扑是加权网络链路预测两个重要特征,本文融合以上两类信息,提出了一个基于图正则化的加权非负矩阵分解的链路预测模型。本文首次将加权非负矩阵分解应用到链接预测中,将加权网络的邻接矩阵映射到低维潜在空间,并使用加权余弦相似度方法获得网络局部结构相似度,并与图正则化相结合保持局部信息。通过拉格朗日乘法更新规去学习模型参数,然后重构加权网络获得预测分数矩阵。分别在八个加权网络上与基于加权结构相似度的链路预测算法和已有非负矩阵分解预测算法比较,实验结果表明我们所提方法在预测缺失链接,权重预测和鲁棒性三个方面上获得高质量性能。然后,在有向网络中,大部分现存的链路预测算法仅考虑链接方向信息而忽略网络局部和全局信息,本文提出了一个基于节点影响力和非对称链接聚类系数的非负矩阵分解的链路预测模型。该模型通过利用非对称链接聚类系数方法计算节点间共同链接方向聚类系数去保持局部结构信息,而利用PageRank算法计算网络的每个节点影响力信息去保持全局结构信息;然后,这两类信息与非负矩阵分解融合组成统一的链路预测模型。在10个真实有向网络上分别与基于有向局部相似度和基于非负矩阵分解预测算法等共9个指标进行比较,结果表明,该模型获得较高的预测准确性。最后,针对所有现存基于非负矩阵分解的链路预测算法都是浅层模型,提出了一个融合拓扑结构与稀疏约束的深度非负矩阵分解的预测模型。该模型运用共同邻居方法计算网络结构相似度,然后将它与网络的邻接矩阵通过深度非负矩阵分解映射到低维潜在空间中可有效捕获隐含层的可观察的链接与结构信息。由于每个隐含层可能包含有来自分解过程中产生的随机噪声,再使用?2,1范数约束每个隐含层的因子矩阵消除随机噪声及不相关特征。最后,整合拓扑结构与稀疏约束信息与深度非负矩阵分解模型共同组成统一的链路预测模型。在8个多层网络上分别与基于非网络嵌入的经典算法和网络嵌入等共14个指标进行比较,结果表明,本文所提方法在迭代次数较小情况下获得高质量性能。
其他文献
图像增强是图像处理的一个重要分支,其目的是通过添加特定信息或进行特定变换来有选择地突出或保持源图像中的重要特征,以得到满足用户需求的结果图像。随着计算机视觉技术的迅速发展和人们对图像质量要求的不断提高,图像增强技术涉及的研究领域日益广泛。由于彩色图像已经非常普及,并且它所包含的内容和表达的丰富信息是灰度图像无法比拟的,因此,对彩色图像增强的研究显得尤为重要。现阶段,重彩色技术和去彩色技术是彩色图像
人类日益扩大的信息交互与传递需求,导致网络运营商需要更高速率,更高稳定性的通信系统来进行人类社会及经济活动的支撑。而全光通信及信号处理在近年来一直是研究热点,被广泛认为是克服当前电光通信系统中“网络瓶颈”的最有效的手段之一。全光信号处理的研究非常依赖于光与物质的相互作用,因此具有更好的非线性光学特性的光学材料的研究迅速成为研究热点。二维材料以它优异的光电特性,在光电器件的应用方面逐渐崛起,并被认为
圆对称结构光因其独特的场分布及光学特性使其在多个研究领域被广泛关注,例如光镊、粒子操控、光学成像、超分辨、量子信息等。特别是在光通信领域,因其携带的空间模式具有无穷的正交区间,可将不同的数据序列加载到不同的模式信道,实现空间模式复用通信。由于圆对称结构光所携带的模式主要通过空间相位和偏振调控来实现,利用相位型或者偏振型调制器件即可实现圆对称结构光模式的复用及解复用。此外,圆对称结构光模式的变换只需
近年来,随机激光器成为了快速增长的一类光源,其中常规的光学谐振腔被无序增益介质(例如激光晶体或半导体粉末)中的多散射反馈所替代,这种类型的激光器具有稳定性好、体积小、价格低廉等突出优点。尽管随机激光器具有许多有趣的特性,但是它们中大部分都缺乏激光的一些基本特质,如方向性和高功率。为克服其不足之处,研究者们相继提出了基于多层结构、空芯光子晶体光纤结构以及波导阵列等低维结构的随机激光器。而基于光纤的随
近年来随着高性能宽带通信系统的演进,无线通信设备的能耗问题日益凸显。常规通过手动更换电池/充电的方法存在人力开销大、成本高和高通信中断率等诸多根本的技术瓶颈,难以在大规模的无线网络,尤其是将来的物联网系统中广泛应用。近年来新兴的无线射频充电技术的兴起提供了一种简便高效的供能方法。通过使用射频无线充电设备,可以远距离对大量的无线设备进行无侵入性的持续供电。这项革新的供电技术也催生了通信领域的一个重要
现代雷达系统为了更有效地检测和跟踪目标,通常需要采用大带宽、多通道的信号处理方式来提升雷达对目标(如距离、速度、角度等参数)的最大探测范围、分辨率、测量精度等探测性能。受限于奈奎斯特采样定理,大带宽往往会带来高采样率和大数据量等问题。然而,目标在雷达探测背景中是高度稀疏的,有效的目标信息只占海量雷达数据的极少一部分,造成了雷达系统在实现目标检测时的资源浪费和效率低下。近年来压缩感知(Compres
以石墨烯为代表的二维材料在生命科学领域中的发展方兴未艾。磷烯(Phosphorene,BP)和锑烯(Antimonene,AM)同属新兴的单元素二维材料,因其独特的物理化学性质,受到人们越来越多的关注,成为当前材料、光电、器件、能源、生命科学等领域的研究热点。针对目前肿瘤光学治疗与诊断中存在的问题,本文在对磷烯和锑烯的合成和光学性质分析之后,聚焦于磷烯、锑烯在生命科学领域中的若干重要问题,提出以下
在生物代谢过程中,蛋白质中的甲硫氨酸残基易被氧化形成甲硫氨酸亚砜,导致蛋白质的空间结构,甚至其功能发生改变。然而,生物体中同时存在特异性的还原酶可以通过还原甲硫氨酸亚砜来逆转这种翻译后修饰。甲硫氨酸亚砜还原酶家族四个成员中,只有MsrB1是含有高还原性(高效抗氧化性)硒代半胱氨酸的硒蛋白。MsrB1高表达于肝脏和肾脏等器官,且在敲除模型小鼠中发现,该小鼠肝脏和肾脏氧化水平均明显升高。另外,有研究表
随着生物医学光子学的发展,高分辨全方位成像和实时在体检测技术逐渐应用于生物样品的立体观测和活体生物追踪,以精细、动态地记录疾病的病理发展过程,研究药物作用效果和动态变化情况。组织光学透明技术与显微光学成像技术的结合,得以对完整样品进行高分辨、深层次、多角度、全方位的精细结构成像。双光子在体显微成像技术则能够对活体动物脑中神经元的生长变化进行动态成像,跟踪记录神经元动态变化过程。而18F-氟代脱氧葡
在二维材料中,电子的行为被束缚在二维平面内,因而描述电子行为的波函数将发生变化。当材料的厚度减小到和激子玻尔半径相当时,量子限域效应将导致其准连续的电子能带变为分立的能级,并且减弱的静电屏蔽作用将导致激子通过库伦作用更牢固的束缚。这些效应会导致二维材料与其相应块体表现出差异性的光物理现象。由于原子量级厚度,光与物质的强相互作用引发独特的非线性光学性质,如谐波产生、非线性折射、多光子吸收等,独特的电