论文部分内容阅读
相较于人脸识别等目标检测技术,行人重识别中的行人检测问题其难点在于行人都是自由状态的,容易产生相互之间的遮挡。理想情况下,深度度量学习中属于某一类别下的各个样本之间的距离应该小于该类别下任一样本和其他类别下样本之间的距离,然而,由于光照、摄像机角度、人的动作形态、着装颜色等问题的干扰,常常会导致目标样本和正例样本之间的距离大于目标样本和负例样本之间的距离,传统的三元组损失函数的提出为解决这个问题提供了思路,但是传统的三元组损失仅仅考虑了目标样本点和正例样本点以及目标样本和负例样本之间的距离约束,这会导致正例样本在靠近目标样本的同时也可能会靠近负例样本。针对上述问题,本文的具体工作如下:(1)本文使用YOLO(You Only Look Once,YOLO)目标检测算法进行行人检测,并针对其对于小目标检测能力较弱、存在重叠程度较高的目标容易漏检的问题进行了改进。在传统的YOLO算法中,当一个行人候选框a与目标候选框b重叠程度超过给定的阈值时,算法会将候选框a的置信度强制归零,导致有重叠的目标候选框a不可能被检出,从而产生漏检,本文对其进行了改进,使用了改进的带线性衰减的非极大值抑制算法来代替了YOLO固定阈值的非极大值抑制算法,当出现上述的重叠候选框时,本文的方法会将候选框a的置信度进行一个衰减,而不是直接归零。同时,本文借鉴了在传统机器学习中特征工程的做法,在原本的YOLO神经网络各卷积层之间加入了批量归一化层,使得数据在进行卷积之前具有固定的均值0,修改了YOLO的网络结构以加快模型的训练速度。(2)本文提出了考虑正例样本和负例样本之间距离约束的三元组损失函数以弥补传统三元组损失函数在行人重识别中行人距离度量学习上的一些不足。传统的三元组损失函数没有考虑正负样本之间的距离约束,导致神经网络收敛缓慢、准确率低。本文提出的改进的三元组损失函数在考虑目标样本和正例样本之间距离以及目标样本和负例样本之间距离的基础之上,加入了正例样本和负例样本之间的距离约束,能够使得正例样本在靠近目标样本的同时远离负例样本,从而更好的进行样本的相似度的度量。