论文部分内容阅读
视频监控网络的快速发展所带来的海量视频给传统人工视频监控分析方法带来了巨大的挑战,基于行人重识别的智能视频分析方法成为计算机视觉研究领域中的重点和热点。行人重识别(Person Re-Identification)是指在非重叠视角域多摄像头网络下进行的行人图像匹配,即确认不同位置的摄像头在不同的时刻拍摄到的行人目标是否为同一人。目前行人重识别的研究算法可以分为两大类:基于特征表示方法和基于模型学习的方法。基于特征表示的方法通过设计一些描述子来提取行人图像中具有区分性和稳定性的特征,而不是从数据中自动学习特征。而模型学习的方法中,基于特征变换学习的方法计算复杂度高且受光照和摄像机参数的影响很大,基于距离度量学习的方法对具有复杂分布的异构数据的鲁棒性不强。为此,本文将采用改进方法提取图像颜色空间特征和对复杂分布的异构数据具有较强鲁棒性的自适应伸缩扩张距离度量学习算法相结合,构建基于HSV特征和自适应距离度量学习的行人重识别系统。本文又采用深度学习方法对行人重识别进行研究,通过深层卷积神经网络自动提取特征来表征行人图像,构建基于深度学习的行人重识别系统。本文的具体研究内容如下:(1)基于图像的颜色空间特性,通过分块分别提取行人图像的HSV子特征,然后进行特征融合,构建表征行人图像的特征向量。介绍了一种自适应收缩扩张的距离度量学习方法,将两者相结合形成基于距离度量学习的行人重识别系统。HSV颜色空间符合人类对颜色的感官认知,其特征分布不会随着图片中目标的形变、旋转、平移的改变而发生改变。本文将HSV特征与改进的M-SEAML(Manhattan Distance-Shrinkage Expansion Adaptive Metric Learning)算法相结合,构建出基于HSV特征和自适应距离度量学习的行人重识别系统。本文的方法在VIPeR[3]数据库下的实验结果Rank1=19.9367%。(2)基于深度学习的行人重识别研究,通过微调训练获得深度卷积神经网络模型,采用该模型进行特征提取,结合分类器进行模型训练,形成基于深度学习的行人重识别系统。训练数据量有限的情况下,在caffe下进行模型微调训练得到深度卷积神经网络模型,通过该模型进行特征提取,采用成对约束的方式把行人重识别问题转化为二分类问题,训练Softmax分类模型,构建基于深度学习的行人重识别系统。在VIPeR[3]数据库下的实验结果Rank1=30.4589%。