多特征融合的行人重识别算法研究及其加速

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:bigfish
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别是一项解决跨摄像头跨场景下的行人的识别与检索问题的技术。该技术最近受到越来越多计算机视觉研究人员的关注。行人重识别算法的核心有两点:一是如何获取行人图片鲁棒的特征表达;二是如何设计好的距离度量方式对行人图片之间的相似性进行评估。传统的行人重识别算法主要是根据人工设计的特征描述和距离度量方式完成行人重识别任务。近些年,得益于深度神经网络强大的特征表达能力,卷积神经网络被越来越多地应用到行人重识别系统中。最近的很多工作表明,使用卷积神经网络模型同时学习行人图片的局部和全局特征表达并将其融合,能够显著地提高行人重识别任务的性能。但是现有的局部与全局特征融合模型不但增加了网络设计的复杂程度,还在特征融合后增加了图片的特征表达维度。此外,现有的特征匹配方式只是对两张行人图片中对应的坐标区域进行相似性度量,没有考虑到行人图片中存在的遮挡与行人框检测不准确的情况,这增加了两张图片相似性评估的难度。现有的性能较好的行人重识别模型的计算复杂度较高,很难满足实时处理大规模数据的需求。因此为了满足系统实时性的要求,行人重识别模型需要一种好的的网络加速算法。本论文针对现有行人重识别方法中存在的问题,分别设计了三种不同的算法进行改善。它们分别是:基于局部卷积神经网络的行人重识别方法、基于显著性区域检测与匹配的行人重识别方法和基于非线性函数的神经网络模型量化方法。基于局部卷积神经网络的行人重识别方法主要用于解决现有方法中局部特征与全局特征融合模型中存在的问题。该方法提出了一种全新的局部网络构建块,能够在仅有少量先验信息的情况下很好地提取行人图片的局部特征。并且该局部构建块的局部特征与全局特征融合操作可以在不同层级特征上完成,不会增大图片的特征表达维度。基于显著性区域检测与匹配的行人重识别方法旨在解决行人重识别检索阶段特征的不合理匹配问题。这种方法的本质是发现行人身体不同部位的显著性区域,然后利用显著性区域信息在特征匹配阶段完成特征对齐。这样可以解决因行人被遮挡或行人检测框不准确带来的特征匹配不合理问题。除了研究提高行人重识别模型的性能,本文还研究了如何对神经网络模型进行加速,从而提高行人重识别模型在实际应用中的实时性。基于非线性函数的神经网络模型量化方法旨在解决现有模型加速中存在的量化过程梯度不匹配和无法量化激活值的问题。该方法从一种全新的视角解释了神经网络量化,设计了一种用于神经网络模型量化的可微非线性量化函数。然后使用连续松弛的方法进行模型量化的训练。本文将我们提出的方法与现有算法进行了实验对比,验证了我们的方法的有效性和先进性。本论文的主要贡献和创新点总结如下:·与GoogleNet、ResNet和DenseNet相比,我们设计了一种全新的融合局部信息和全局信息的神经网络构建块,该构建块可以简单而有效地插入到任意一个神经网络模型中的任意位置。利用该局部构建块的局部卷积神经网络模型在现有的行人重识别数据集上获得了很好的性能。·与现有行人重识别模型相比,本文从特征对齐的角度设计了一种人体显著性区域特征提取及匹配方法,该方法用于解决行人重识别任务中因为图片中行人身体缺失或被遮挡带来模型性能下降的问题。·与现有的低比特量化方法相比,我们首次将量化描述为一个可微的非线性映射函数,从而为任意比特权和激活量化提供一个简单直接且通用的解决方案。该方法不会遇到严重的梯度失配问题,并且可以以无损的端到端方式进行学习训练。
其他文献
导数知识是“高等数学”中极其重要的部分,它的内容、思想和应用贯穿于整个高等数学的教学之中。微分中值定理和导数应用是导数知识中的重要内容,它们在不等式证明中有着广泛的
鱼纹饰是我国传统造型艺术中喜闻乐见的一种纹饰,经过漫长的社会演化,形成了我国民间独特的鱼文化。通过各个时期各种器物上鱼纹饰的描述来展示传统民间生活形态中鱼的艺术,对今
目的探讨腹腔镜下腹直肌前鞘子宫固定术治疗子宫脱垂的疗效.方法就昆明医科大学第三附属医院2013年5月2例III度子宫脱垂患者行腹腔镜下腹直肌前鞘子宫固定术及曼氏手术(Manche
自1999~2000年我院门诊确诊了2.322例 STD患者,现根据临床资料分析如下.
本文设计了LTE下行链路在空间复用与传输分集技术之间自适应切换的多天线传输方案,实现了系统容量和传输质量的良好折中。系统仿真结果表明,自适应切换的多天线方案能够有效提
中长跑项目是普通高等院校体育教学中重要的教学内容之一 ,培养大学生对中长跑运动的兴趣 ,必须从明确该项目锻炼的社会价值和作用出发 ,了解中长跑的生理特点 ,增强战胜困难
文中对大型龙门加工中心移动式隔音房结构组成进行了详细阐述,介绍了移动式隔音房的主要技术参数及要求,通过在企业的实际运用,取得了很好的效果挚可为同行业移动式隔音房的设计
目的:分析多层螺旋C T静态与动态扫描曲面重组结合多平面重组对咽鼓管显示的效。方法:选取2017年1月—2019年3月在本院接受检查的50例正常人作为研究对象,依据随机原则将其分
本文概述了近年来有关遗传性疾病、肿瘤等基因突变以及感染性疾病病原微生物核酸检测技术,着重阐述了核酸杂交、扩增、检测信号扩增等分子生物学技术的有关发展,并简要介绍了我
在3GPP的演进技术LTE之后,3GPP继续对LTE方案进行增强。在接入网的架构中增加了中继节点(relay node,RN),该节点可以看作是eNodeB的延伸,为系统提供更经济的覆盖。在此基础上,