论文部分内容阅读
视觉跟踪是计算机视觉的重要研究领域。在视觉跟踪的研究中,行人跟踪是最重要、最有价值的研究课题之一。行人姿态相比其他目标变化更大,跟踪时遇到的问题会更多,同时在实际跟踪环境中,往往是多行人的情况,多行人跟踪相对单目标跟踪情况更为复杂,包括目标数目的动态变化,目标之间的遮挡、合并和分离等。多目标跟踪问题通常采用基于检测的跟踪方法,首先检测目标并定位,然后进行目标关联,最后实现跟踪。本文针对一般监控场景下的多行人跟踪问题进行研究,重点针对多行人跟踪过程中行人目标在遮挡、光照变化、尺度变化、数目动态变化等情况下的有效检测和跟踪问题,分别对检测算法和跟踪算法进行了改进。主要研究成果如下:针对行人检测问题,提出了基于MobileNet的深度回归卷积神经网络模型。利用深度特征强大的表征能力提高行人检测的准确率,同时为实现快速的深度卷积特征提取,采用具有快速卷积特点的MobileNet作为主干网络来极大减少检测时间。在公开数据集Pascal VOC 2012以及自建数据集的测试结果表明,该算法能够实现对多行人的快速准确检测和定位。针对行人跟踪问题,在经典的粒子滤波跟踪框架基础上,对其重采样过程中存在的粒子退化和粒子匮乏问题,利用风驱动算法进行了改进,提高了其跟踪能力;同时采取颜色特征、HOG特征和LBP特征相结合的方式,增强对行人目标的特征表达能力,提高了粒子滤波跟踪框架中目标观测模型的观测能力。提出了基于检测的多行人跟踪算法框架,首先利用基于深度卷积神经网络的行人检测算法对行人进行准确的检测和定位;其次进行观测值与跟踪轨迹的目标关联,将多行人跟踪分割为单目标跟踪问题;最后利用改进的粒子滤波跟踪算法进行跟踪,同时针对目标的消失、新目标的出现和目标的合并、分离问题提出了解决方法。基于Windows10和VS2015平台设计了一个多行人检测与跟踪系统,能够实现一般监控场景下对多个行人的自动检测定位和准确跟踪。