论文部分内容阅读
目标跟踪在过去几十年中备受关注,并且广泛应用于诸如监视,机器人技术和人机交互等众多视觉应用中。尽管相关研究已经取得了许多的进展,但对于减少光照变化,遮挡等众多因素所带来的影响,及保证目标跟踪的实时性,仍然是当前研究的核心问题。近年来,卷积神经网络在各种视觉任务中展示出了其卓越的能力,尤其在目标跟踪中使用效果显著。受益于卷积网络层次化特征抽象表达能力,一些跟踪器将深度特征集成到常规跟踪方法中;在充分利用端到端训练的基础上,其他一些跟踪器直接将卷积网络作为分类器引入。虽然这些方法的引入点不同但都是通过采用在线训练来提高跟踪性能。由于卷积神经网络特征和深度神经网络的复杂性,跟踪算法在线训练时的计算量很大。以至于基于卷积神经网络的在线跟踪器的运行速度不能够满足目标跟踪实时要求。对此,基于孪生网络的跟踪器应运而生,由于其高速和准确性而备受关注。孪生跟踪器将目标跟踪任务定义为相似性学习问题,通过学习目标模板和搜索区域特征表示间的互相关来实现目标跟踪。但当跟踪目标外观变化明显或背景复杂度较高时,跟踪器的泛化性和判别性很差。针对提高跟踪器的泛化性,判别性及实时性,本文提出了两种基于孪生网络的实时目标跟踪网络结构。由于为图像分类任务而训练的深层卷积网络中,越深层所抽取的图像特征中所包含的语义信息更丰富,且对图像中主体对象外观变化不敏感,但能将真实目标与欺骗性混乱背景区分开的判别性较低。对此,本文提出一种基于注意力引导的全卷积孪生网络,用以提高全卷积孪生网络(SiamFC)跟踪器的判别性。同时,当前的一些孪生网络跟踪器中所使用的骨干网络相对较浅,并没有充分利用到深层神经网络的优势。并且用现有功能强大的网络架构直接替换孪生跟踪器中骨干网络对跟踪效果进行改善,效果并不明显。对此,本文提出一种基于残差孪生网络的实时目标跟踪算法,在充分利用更深的卷积神经网络来增强目标跟踪的泛化性和判别性的同时实现实时目标跟踪。具体内容如下:(1)基于注意力引导的全卷积孪生网络目标跟踪算法:针对复杂背景,即有太多相似性物体的时候,跟踪效果不好的问题,本文设计了一个通道注意力模块块,并把它嵌入到SiamFC的一个分支中,使其可以根据目标位置周围的通道激活来计算通道权重。并且基于SiamFC的体系结构使跟踪器可以实现实时运行。最后在Got-10k数据集上配合经评估方案对所提目标跟踪算法进行验证,且跟踪效果优于SiamFC跟踪器。(2)基于残差孪生网络的实时目标跟踪:当前的孪生跟踪器仍存在精度差异,即当目标有外观变化,经常会跟踪失败,并且无法利用深层网络特征来提高跟踪精度及时效。对此,本文采用新的残差模块,并在此模块的基础上进一步设计新的残差网络体系结构CIResNet-22,用其去替换孪生网络跟踪器中骨干网络。由于CIResNet-22是轻量化网络结构,故可以在保证目标跟踪性能的同时实现实时跟踪。最后在OTB-2013数据集上,依据成功曲线的精度和曲线下面积两个评估指标进行目标跟踪算法排名,实验结果表明所提出的方法要优于其他方法。