论文部分内容阅读
行人再识别技术指的是不同摄像机镜头对不同时间、地点捕捉到的行人进行匹配的过程。行人再识别技术因其广泛的应用以及研究价值,已经成为计算机视觉等相关领域的研究热点,对于维护社会公共安全具有重要现实意义。行人再识别技术研究主要分为两方面:特征表示和度量学习。有效的特征表示应该能抑制光照以及视角变化造成的影响。目前,特征表示最常用的就是对颜色特征和纹理特征按照不同要求进行组合;度量学习则是通过监督、无监督等方式学习得到一种能反映数据间内在关系的距离函数,使得数据样本保持较好的可分性,从而达到提高匹配准确率的目的。基于度量学习的行人再识别实质上是通过高维空间特征向低维子空间的映射实现特征的降维,从而使样本具有良好的可分性。但在实际研究中发现,通过不同的方法寻找合适的低维子空间往往存在着不同的缺点,例如,模型的泛化能力低、参数优化等问题。本文针对不同算法的具体不足,做了如下工作:(1)探讨了顶推距离度量学习算法(Top-push distance learning,TDL)在拟合不同摄像头下的行人外观差异中存在的过拟合问题。本文将迹范数(Trace Norm)引入到顶推距离度量学习算法中,提出基于正则化的顶推距离度量学习算法(TDL-T)。在该算法中:首先,在构造代价函数时,将正样本对之间的距离与负样本对之间的最小距离作比较,而不是与每一个负样本对距离作比较,增强约束来构造新的代价函数;其次,通过引入迹范数得到矩阵的低秩,缓解过拟合问题,从而简化模型的复杂程度;最后,通过对PRID 2011和iLIDS-VID数据集上的对比试验,验证本文算法在解决模型泛化能力方面的有效性。(2)将扰动线性判别分析(Perturbation Linear Discriminant Analysis,PLDA)算法引入到交叉二次判别分析(Cross-view Quadratic Discriminant Analysis,XQDA)算法中,用于解决XQDA算法中因矩阵奇异导致的参数优化问题。在该算法中,通过引入扰动随机向量来模拟类经验均值与期望均值之间的差异,通过广义瑞利熵形式求解得到最优的度量矩阵。最后,通过仿真实验证明了参数优化对提高算法的有效性。