论文部分内容阅读
视觉目标跟踪(Visual Object Tracking)是计算机视觉和模式识别领域的重要课题之一,在智能交通、视频监控、人机交互、智能导航等领域有着广泛的应用。典型的视觉目标跟踪算法主要由表观建模、目标状态搜索和表观模型更新三个部分组成,其中表观建模处于核心地位,直接影响目标跟踪效果。尽管研究者提出了大量针对视觉目标跟踪的表观建模方法,然而设计一个适用于实际应用中各种复杂跟踪环境的鲁棒表观模型,仍然是目标跟踪领域的难点问题之一。本文从多特征融合精度、遮挡的检测与处理、表观模型的稳定性和判别性以及多目标跟踪中不同目标物的有效区分等方面对表观建模方法展开研究与讨论,主要研究内容包括以下四点:基于多特征融合的表观建模方法研究。多特征融合方法是表观建模的常用方法,其核心问题是如何准确评估不同特征对目标的描述能力,从而在目标跟踪过程中自适应调整特征融合权重,利用特征之间的互补性提高表观模型的鲁棒性。为了提高多特征融合方法中特征融合的精度,本文提出了一种基于局部核加权的多特征融合表观建模方法。将目标区域分解为多层次的子图像块,在每个子图像块上分别提取背景加权特征直方图,以子图像块为单位调整特征间的融合权重。该方法突出了图像特征对目标局部区域的描述能力,提高了目标整体表观模型的特征融合精度。实验结果表明所提出的方法相比于传统的多特征融合方法具有更好的跟踪精度和稳定性。目标跟踪过程中的遮挡检测与处理方法。遮挡一直是视觉目标跟踪中的一个难点问题。本文针对基于稀疏表示的目标跟踪方法中普遍采用的单位噪声矩阵对目标遮挡描述能力较差的问题,提出了一种局部稀疏表示表观模型对目标遮挡区域进行检测。以此为基础,在候选观测似然计算过程中以及目标观测模板更新过程中,显式地对遮挡区域进行限制与修正,在一定程度上减轻了遮挡对目标跟踪定位的负面影响。实验结果表明,所提出的方法对目标跟踪过程中的各种遮挡情况具有较好的鲁棒性。基于稀疏编码的表观建模方法研究。在前面的方法中,我们利用稀疏表示对目标局部图像块的表观特征进行描述,取得了较好的遮挡检测效果。然而该方法只考虑了如何有效地对目标的局部图像特征进行描述,并没有考虑局部特征之间的空间结构信息对目标的描述能力,以及局部特征对目标表示的判别能力。为了提高表观模型的稳定性和判别能力,本文提出了一种基于判别式稀疏编码的表观模型。首先,提出一种判别式基函数学习方法,使得局部图像块的稀疏编码系数向量对目标和背景具有更好的区分度。然后,将所有局部图像块的稀疏编码向量按照结构化方式进行聚集,生成目标整体特征向量。并在聚集过程中,提出了一种基于特征维度可分性统计的降维方法,对稀疏编码向量中的噪声进行过滤,从而进一步提高整体目标特征向量的类间区分度。最后,将目标跟踪问题转化为一个二分类问题实现目标定位。实验结果表明,所提出的方法对光照变化、严重遮挡、混乱背景等复杂跟踪环境具有较好的适应力。多目标跟踪中的表观建模方法研究。在对单目标跟踪任务中表观建模方法进行了研究与讨论的基础上,我们将研究内容扩展到多目标跟踪任务中。相比于单目标跟踪,多目标跟踪更为复杂。除了要应对来自目标自身和外界环境的各种变化以外,多个跟踪目标之间经常出现的相互遮挡和交替并行等情况,使得多目标跟踪面临着更大的挑战。为了解决多目标跟踪中由于目标物外观相似、空间距离相近等因素造成的目标之间区分困难的问题,本文提出了一种基于SRC(Sparse Representation based Classification)和MFH(Multiple Features Hashing)的联合表观模型。首先,将多个目标物的区分问题转化为一个SRC问题,构造了一个基于SRC的判别式全局表观模型,用以区分所有目标。其次,针对空间距离较近,区分较为困难的二元目标对,构造了一个基于MFH的局部二元区分模型,提高算法对困难二元目标对的区分能力。最后,给出了一种启发式优化算法,求解联合表观模型下的较优关联矩阵。实验结果表明,所提出的方法能够有效提升多目标跟踪效果,尤其在减少目标身份变换方面效果较为明显。