论文部分内容阅读
在信息技术快速发展的今天,我国社会公共安全问题并没有被解决,并且随着人们对自身安全、社会安全的愈加重视,越来越多的安全隐患等待着监管部门解决。其中视频监控系统是政府或企业用于控制和发现安全隐患的基本手段,已经成为新型智慧城市建设的重要内容,智慧视频监控系统涉及到的关键技术问题被广泛研究。目标跟踪是监控系统的基础技术之一,为人群行为分析、视频异常检测等上层应用提供支撑,另外,深度学习主要应用于视觉和自然语言处理领域,并取得了突出的研究成果。因此,研究并应用深度学习来解决目标跟踪问题中,对于目标跟踪的技术发展具有重要意义。目标跟踪中主要的研究难点在于视频场景中复杂的干扰因素对目标判别造成的影响,以及目标在运动过程中自身发生的变化,例如遮挡和形变。对于这些复杂的干扰因素还有很多问题没有解决,本文主要研究如何提升模型对目标的表征能力、解决遮挡的问题来提高模型对干扰因素的适应能力,主要的研究内容如下:(1)研究并实现了基于高置信度的相关滤波改进算法。在目标特征处理方面,从上下左右四个方向各选取背景信息块提取相关的背景特征来增强对目标的表达能力,并采用颜色直方图模型提取目标的颜色特征,在另一维度提取目标的特征值。使用双通道并行计算响应图并预测目标存在的位置,模型更新方面,根据响应图的振荡情况对模型进行更新,当响应图振荡程度较小时,对两通道的模型进行更新以减少错误信息带来的干扰。该优化策略加强了目标特征的表达,在一定程度上减少了模型的更新,提升了跟踪速度。实验证明了改进的策略提升了模型跟踪的准确性。(2)研究并实现了基于特征融合的深度残差学习跟踪模型。模型使用深度学习网络提取目标的深度特征,使用残差网络的思想构造网络层对特征进行快速学习,并根据下一帧图像的信息计算目标位置。设计三通道网络提取目标不同维度的特征,并同时训练对应的残差网络,以提升跟踪模型的准确度。另外,通过额外增加计算通道提取颜色直方图的特征对模型进行补充,多维度特征产生的响应图融合策略采用线性融合的方式,根据特征的重要程度设定不同权重值。实验表明该模型在各项指标上得到了提升,模型的鲁棒性更好,对于以人物为目标的视频场景有更好的适应能力。通过调整特征的融合策略,模型处理遮挡的能力得到了改善。