论文部分内容阅读
视频目标跟踪是计算机视觉研究领域重要分支,跟踪任务需综合应用多领域知识,并应对多种突发情况从而鲁棒追踪目标。深度网络自动特征有先验条件多、泛化性能好、层级结构特征丰富等特点,适宜弥补手工特征表达能力相对不足问题,增强算法鲁棒性,改善跟踪算法性能。当前深度学习跟踪算法通常只利用最终整体目标置信度,忽视网络中间特征及多样跟踪方式,因此更细致充分结合网络与跟踪流程是提高算法性能的一个重要方向。为实现深度学习与目标跟踪细粒度融合,从在跟踪知识引导下充分利用网络丰富特征角度出发,提出基于深度网络的多层级特征跟踪算法(Deep Network Multiplexed Layer Feature Tracking,MLT)。从利用子块灵活跟踪优势出发,提出基于多网络的子块视觉跟踪算法(Multiple Network Subblock Tracking,MNT)。MLT利用网络多元表述能力,使网络层级特征与跟踪流程交互。金字塔式利用各卷积层特征构建表观模板,训练目标专用判别网络推断目标状态,反向推导输入层显著性图区分干扰因素辅助更新,利用一次前后向网络传导高效紧凑获取特征信息。同时利用专用网络及显著性图提出三阶段模板恢复策略。实验证明MLT算法的多层级特征选用及模板恢复策略一定程度应对长时全遮挡及剧烈形变情形,保证跟踪结果的准确性和鲁棒性。MNT以子块分割形式结合深度学习与目标跟踪。利用拉普拉斯算子滤波图像,选择灰度层次丰富子块。迁移应用大规模小尺度图片集训练中等深度网络跟踪子块,降低计算复杂度并提高识别精度。根据长短时更新策略存储样本,调整网络。实验证明MNT能较有效跟踪目标,并应对局部形变、光照变化等挑战。