论文部分内容阅读
行人重识别是一项解决跨摄像头跨场景下的行人的识别与检索问题的技术。该技术最近受到越来越多计算机视觉研究人员的关注。行人重识别算法的核心有两点:一是如何获取行人图片鲁棒的特征表达;二是如何设计好的距离度量方式对行人图片之间的相似性进行评估。传统的行人重识别算法主要是根据人工设计的特征描述和距离度量方式完成行人重识别任务。近些年,得益于深度神经网络强大的特征表达能力,卷积神经网络被越来越多地应用到行人重识别系统中。最近的很多工作表明,使用卷积神经网络模型同时学习行人图片的局部和全局特征表达并将其融合,能够显著地提高行人重识别任务的性能。但是现有的局部与全局特征融合模型不但增加了网络设计的复杂程度,还在特征融合后增加了图片的特征表达维度。此外,现有的特征匹配方式只是对两张行人图片中对应的坐标区域进行相似性度量,没有考虑到行人图片中存在的遮挡与行人框检测不准确的情况,这增加了两张图片相似性评估的难度。现有的性能较好的行人重识别模型的计算复杂度较高,很难满足实时处理大规模数据的需求。因此为了满足系统实时性的要求,行人重识别模型需要一种好的的网络加速算法。本论文针对现有行人重识别方法中存在的问题,分别设计了三种不同的算法进行改善。它们分别是:基于局部卷积神经网络的行人重识别方法、基于显著性区域检测与匹配的行人重识别方法和基于非线性函数的神经网络模型量化方法。基于局部卷积神经网络的行人重识别方法主要用于解决现有方法中局部特征与全局特征融合模型中存在的问题。该方法提出了一种全新的局部网络构建块,能够在仅有少量先验信息的情况下很好地提取行人图片的局部特征。并且该局部构建块的局部特征与全局特征融合操作可以在不同层级特征上完成,不会增大图片的特征表达维度。基于显著性区域检测与匹配的行人重识别方法旨在解决行人重识别检索阶段特征的不合理匹配问题。这种方法的本质是发现行人身体不同部位的显著性区域,然后利用显著性区域信息在特征匹配阶段完成特征对齐。这样可以解决因行人被遮挡或行人检测框不准确带来的特征匹配不合理问题。除了研究提高行人重识别模型的性能,本文还研究了如何对神经网络模型进行加速,从而提高行人重识别模型在实际应用中的实时性。基于非线性函数的神经网络模型量化方法旨在解决现有模型加速中存在的量化过程梯度不匹配和无法量化激活值的问题。该方法从一种全新的视角解释了神经网络量化,设计了一种用于神经网络模型量化的可微非线性量化函数。然后使用连续松弛的方法进行模型量化的训练。本文将我们提出的方法与现有算法进行了实验对比,验证了我们的方法的有效性和先进性。本论文的主要贡献和创新点总结如下:·与GoogleNet、ResNet和DenseNet相比,我们设计了一种全新的融合局部信息和全局信息的神经网络构建块,该构建块可以简单而有效地插入到任意一个神经网络模型中的任意位置。利用该局部构建块的局部卷积神经网络模型在现有的行人重识别数据集上获得了很好的性能。·与现有行人重识别模型相比,本文从特征对齐的角度设计了一种人体显著性区域特征提取及匹配方法,该方法用于解决行人重识别任务中因为图片中行人身体缺失或被遮挡带来模型性能下降的问题。·与现有的低比特量化方法相比,我们首次将量化描述为一个可微的非线性映射函数,从而为任意比特权和激活量化提供一个简单直接且通用的解决方案。该方法不会遇到严重的梯度失配问题,并且可以以无损的端到端方式进行学习训练。