论文部分内容阅读
我国现代安防建设已经发展了几十年,从“数字城市”的倡议到如今以物联网和人工智能为基础的“智慧城市”的倡导,国家安防建设已经度过了雾里看花的阶段,在现代化、智能化的道路上迅速前进。由于搭建了庞大的安防网络,安防任务需要处理的监控数据量大,而传统先存储监控数据再分析的方式不具有实时性且效率低下。基于深度学习的行人属性识别技术能有效结合现代监控网络,实时分析,快速定位可疑人物,帮助我国应对安防领域的新难题,加速智慧城市建设。行人属性含义宽泛,行人的性别、年龄、衣物款式、姿势等均为行人属性。行人属性识别属于计算机视觉技术范畴,通过将低层次语义信息向中层次语义信息转换来实现属性识别。行人属性识别包含特征提取器提取特征,分类器分类等步骤。传统机器学习算法由研究人员来设计特征,但在面对行人属性识别任务时,由于实际图像会有亮度偏暗、遮挡等情况,人工设计特征难度较大且泛化性不佳,而深度学习技术由模型自己学习必要的特征,并自行挖掘行人属性之间的联系,故而在处理实际行人属性识别任务时,深度学习方法表现出了更强的鲁棒性。本文首先介绍了行人属性识别技术的研究现状,然后对其中用到的主要技术加以说明,最后使用了基于多属性融合训练思想的残差神经网络进行行人属性识别实验。50层残差神经网络创新性地采用了瓶颈结构,瓶颈结构使网络浅层的特征信息更容易往深层传递,因此基于该结构的网络层数更多,能处理更复杂的任务。选用残差神经网络作为主干网络让训练出的模型在面对安防场景下复杂的环境和角度变化时有更好的识别表现。本文实验共包含两部分,在第一部分本文为带权重的sigmoid交叉熵损失函数定义了缩放参数,研究缩放参数的调整对不同正例率行人属性的影响。使用50层残差神经网络和处理后的RAP2.0数据集完成实验,实验取消了随机失活设置以降低随机性。实验使用查准率、查全率、F1分数这三个指标评判结果,发现在一定范围内,增大缩放参数会降低模型识别正例率较高的行人属性的查准率、查全率和F1分数同时提高正例率低的行人属性在这三项指标上的表现。而缩小缩放参数则会有相反的效果。这为行人属性识别工程应用时,以模型识别正例率高的行人属性表现为代价,提升模型识别行人属性表现的平衡性提供了实验依据。第二部分实验建立了在行人属性识别项目中,拓展模型可识别行人属性时,利用行人属性间的相关性,短时间内增加新增行人属性的数据量并以此提升模型识别准确率的流程。此部分使用50层残差网络进行实验。实验中通过该流程拓展鞋子款式属性的数据集,首先验证了在年龄、上衣款式、上衣颜色、裤子款式、裤子颜色以及鞋子颜色6种行人属性中,鞋子款式和鞋子颜色属性相关性最强。通过将两种强相关属性联合训练,提升模型预标注鞋子款式属性的准确率,减少人工二次清洗所需时间。在一周内,5次流程迭代后拓展了2600张鞋子图像和对应标签,模型识别鞋子款式准确率相比仅通过公开数据集训练获得了2.7%的提升,证明该流程利用行人属性间的强相关性,有效提高了新属性数据集的扩充效率,提升了模型表现。两部分实验使用的系统为Ubuntu,框架为Py Torch。实验使用RAP2.0数据集,数据集由安防图像和标签组成,标记属性多,符合实验要求。