论文部分内容阅读
视觉目标跟踪作为连接计算机视觉系统底层的信息处理技术到高层的信息内容分析的桥梁,在智能辅助驾驶以及智能视频监控等领域具有非常重要的研究价值。通过在下一帧图像中找到目标的确切位置并反馈给辅助驾驶系统或视频监控系统进行跟踪,视觉目标跟踪为视频序列分析和理解提供重要的运动信息。本文针对如何实现复杂环境下对运动目标的鲁棒跟踪以及在实际应用中如何兼顾跟踪算法的鲁棒性和实时性等问题,基于稀疏学习理论对视觉目标跟踪算法进行了深入研究。第二章概述了稀疏学习理论以及基于稀疏学习跟踪算法的基本原理。在此基础上,第三章提出了一种基于RGBD和稀疏学习的跟踪算法,通过有效地利用深度数据提供的有效信息,提升了算法在光照剧烈变化以及各种遮挡影响情况下的鲁棒性。第四章提出了一种基于双目视觉和稀疏一致性学习的跟踪算法,通过有效地利用双目视觉提供的目标外观与深度信息,进一步提升了算法在目标位姿剧烈变化情况下的鲁棒性并明显改善了算法效率。为了满足实际应用中实时性的需求,第五章提出了一种基于分层卷积特征和稀疏学习的跟踪算法,通过滤除对目标跟踪无效的卷积特征,同时提高了算法的精度和效率;提出了一种基于粒子滤波的分层目标定位方法,有效地解决了尺度适应性问题。本文的主要工作和创新性研究成果如下:1)提出了一种基于RGBD和稀疏学习的跟踪算法,充分利用深度数据提供的有效信息,明显提升了算法在光照剧烈变化以及各种遮挡物影响情况下的跟踪效果。基于稀疏学习的跟踪框架,该算法首先使用深度信息对目标区域内的遮挡物进行检测,并将检测出的遮挡物区域作为模型用于生成遮挡物模板。通过在现有的超完备字典中增广遮挡物模板空间,使得算法具备适应各种极端遮挡情况的能力。考虑到深度信息对光照变化的不敏感性,将深度图像特征结合基于彩色图像的视觉特征用于目标外观的鲁棒特征描述。最后,为了避免错误的模板更新,提出了一种基于深度直方图分析的遮挡物检测方法。基于KITTI和Princeton数据集的实验结果表明,相比较于当下流行的跟踪算法,包括基于稀疏学习的跟踪以及基于RGBD的跟踪,所提出的算法实现了更好的整体跟踪效果。2)提出了一种基于双目视觉和稀疏一致性学习的跟踪算法,充分利用双目视觉提供的目标外观与深度信息,进一步提升了算法在目标位姿剧烈变化情况下的跟踪效果并改善了算法效率。该算法首先将双目视觉提供的目标区域优先外观信息表示为交叉模板,并将构建的交叉模板空间用于增广现有的超完备字典,提高了算法在目标位姿剧烈变化情况下的精度和鲁棒性。然后在联合稀疏表示求解过程中引入了深度一致性约束,通过结合行稀疏约束获得更为稳定的跟踪结果。最后基于深度一致性特性即连续两帧图像序列之间目标的深度分布不会发生明显的变化,将距离目标区域较远的奇异粒子滤除,进而明显提高了算法效率。基于KITTI数据集的定性与定量分析表明,该算法的跟踪效果优于当下最先进的多类跟踪器,包括基于稀疏学习的跟踪以及基于双目视觉的跟踪。3)提出了一种基于分层卷积特征和稀疏学习的跟踪算法,充分利用卷积神经网络强大的特征提取能力以及相关滤波器出众的计算效率,可以实现复杂环境下对运动目标的实时跟踪。该算法提出了一种基于稀疏学习的卷积特征筛选策略,通过滤除对目标跟踪无效的卷积特征,明显改善了跟踪效果并提高了算法效率。与此同时,设计了一种基于粒子滤波的目标定位方法,通过对跟踪物体进行从上至下地分层定位,有效地解决了尺度适应性问题。