论文部分内容阅读
随着高性能计算机的广泛应用,高质量且低廉的摄像设备的易用性,加速了人们对视频内容自动分析和处理的需求,极大地推动了计算机视觉领域中视觉目标跟踪技术研究的发展。视觉目标跟踪在计算机视觉领域中具有重要的研究意义和实用价值,并且已经广泛应用于现实生活中,在现实世界中扮演了重要角色。视觉目标跟踪仅利用视频第一帧中目标的初始状态,包括目标的区域、大小和位置等信息,预测后续视频中图像序列的目标状态。因此,在光照变化、尺度变化、遮挡、形变和背景杂乱等复杂场景下,如何快速鲁棒地跟踪目标是一个亟待解决的问题。本文旨在为人们提供视频内容自动分析和处理的关键性支撑技术,从视频内容自身特性出发,对基于相关滤波的视觉目标跟踪相关技术展开研究。为了提升目标跟踪的性能且满足实时性需求,本文提出了基于互补学习器的鲁棒实时的视觉目标跟踪方法。此外,本文提出了一个基于背景抑制深度特征的视觉目标跟踪方法,以进一步提升视觉目标跟踪的精度。本文的主要贡献包括以下几个方面:1.提出了一个基于互补学习器的鲁棒实时的视觉目标跟踪方法,利用多种低维的互补特征和自适应在线重检测组件,提高目标跟踪的速度和精度。在复杂场景中,由于单种特征表示具有局限性,而多种特征融合则有冗余信息和噪声干扰且耗时,现有的基于相关滤波的目标跟踪方法无法学习鲁棒的相关滤波器。通过考察多种特征中各自的优势,本文利用多种低维互补的特征学习相关滤波器,并与颜色直方图模型融合,提升视觉跟踪的鲁棒性和速度。此外,本文引入自适应在线重检测组件,可以有效地处理跟踪失败的问题。在国际上公开且广泛采用的基准数据集OTB2015上,本文和现有先进的跟踪方法进行了全面的实验对比,本文的方法在性能和速度上都取得了非常有竞争力的结果。2.提出了一个基于背景抑制深度特征的视觉目标跟踪方法,利用前景的概率图引导相关滤波模型仅关注对其有用的深度特征,从而提高目标跟踪的鲁棒性。现有的基于深度学习的视觉目标跟踪方法通常采用网络中某一层深度特征学习相关滤波器。其中高层特征提供低分辨率的语义信息,无法对目标进行精确的定位,而底层特征拥有高分辨率的纹理、边缘和颜色等信息,抗干扰能力差。考虑到高层特征和底层特征各自的优势和局限性,本文融合多层深度特征学习相关滤波器,以提高模型的判别能力。为了缓解边界效应,本文利用前景概率图引导相关滤波器自动选择深度特征中对判别模型有用的部分。此外,本文提出了一个半自适应的模型更新策略,以避免模型污染和提高跟踪速度。在国际上公开且广泛采用的基准数据集OTB2013和OTB2015以及挑战数据集VOT2016上,本文对提出的方法进行了全面的评估。与现有先进的基于深度学习的方法相比,本文的方法获得了出色的性能。基于研究技术的成果,本文实现了一个基于互补学习器的鲁棒实时的视觉目标跟踪原型系统。在该系统中,本文的方法可以快速鲁棒地跟踪目标,从而验证了本文方法的技术可行性和实用性。