论文部分内容阅读
随着社会经济的日益发展,人们安全意识的日益提高,大量的监控摄像头被安装到公共场所用于日常安全监控。面对海量增长的监控视频数据,人工早已无法应对,利用计算机技术对视频数据自动识别和处理的需求应运而生。在监控视频中,人向来是被重点关注的对象。行人再识别问题是指,在光照、摄像头监控环境以及行人姿态等条件会发生变化的前提下,如何确认不同位置的摄像头在不同时刻发现的目标是否为同一个人。这对于刑事案件侦查破解、公共场合寻找丢失的小孩、行人的检索、个人相册管理、多摄像机行人跟踪和行为分析、电子商务等领域都具有重要的研究意义。行人再识别问题是图像处理、计算机视觉领域最具挑战性的问题之一。行人再识别问题之所以具有挑战性,主要有两个方面的因素,第一,其处理流程非常复杂。行人再识别的总体流程首先是前景提取,即将待处理的行人从图像背景中分离出来;然后针对前景提取有辨别力的特征(如颜色、纹理或者超像素特征等),并对提取的特征进行有效融合;最后通过相似性度量判别两幅行人图像是否为同一个人。任何一步出现问题,都会影响最终的识别效果。第二,其处理过程面临诸多的挑战。由于不同监控环境下摄像头参数不同,行人外貌特征会发生变化,视频图像的传输过程可能会受到干扰,拍摄环境以及光照等也会发生变化,使得最终的识别准确度通常不高。针对上述问题,本论文提出了改进的BOF(Bag of Feature)特征提取算法,并融合协方差描述符,应用于行人再识别问题中。本论文的主要工作与创新如下:首先,针对BOF算法的缺点,通过SURF(Speeded Up Robust Feature)算法来对其进行改进。SURF算法提取图像初步的特征描述符并生成视觉词典,应对光照、尺度不变等影响因素,并通过PCA降维来降低算法复杂度,提高运行效率,以及解决存储要求过高的问题。结合提取的SURF特征和K-Means聚类,对图像划分多层,应用空间金字塔匹配原理对生成的视觉词典进行直方图表示,充分利用图像的空间信息,以提高行人再识别匹配分类的准确度。其次,结合了LIBSVM改进BOF算法,设计出了有效的分类器。通过改进的BOF算法提取出的高鲁棒性特征,使用高效的LIBSVM分类器融入到行人再识别算法中,提高了行人再识别的效率。再次,加入协方差描述符的构造方法,提高特征鲁棒性。通过使用SURF算法以及空间金字塔匹配原理代替简单的颜色、梯度等特征,不仅保留了改进的BOF算法对于特征提取的优点,也同时加入了协方差描述符高鲁棒性的优点。通过LIBSVM进行最后的行人再识别的匹配验证,对于少样本的行人再识别问题,提高了对于同一个行人匹配的准确率。最后通过使用VIPeR数据集、CUHK01数据集和ETZH数据集,与当前行人再识别主流的SDALF、ELF、LMNN、BiCov算法进行比较,并通过CMC曲线的对比效果证明,本论文的方法与当前主流的行人再识别方法相比,匹配率具有明显的优势。