可扩展行人重识别的模型构建方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:zhqr1981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
行人重识别是一种利用计算机技术判断摄像机收集的视频或图像中是否存在特定行人的技术,可以自动地对多个不交叉摄像机捕捉的行人图像进行匹配,因而在智能监控系统中发挥着显著作用。但现有的大多数行人重识别方法是在单个有标记数据集上进行训练和测试的,如果在源数据集上训练的模型直接应用到目标数据集上会产生因行人图像风格差异等因素引起的域偏移问题,从而导致最终的识别精度很低。现实场景中已标记的行人样本是极度缺乏的,这表示在已标记单域上训练和测试的有监督行人重识别方法无法有效的应用到实际场景中,从而导致该类方法的扩展性差。其主要原因有两点:1)不同数据集的行人图像因摄像机分辨率、视角和光照等因素的影响存在很大的风格差异,从而导致不同数据集间存在域偏移问题;2)目标数据集缺乏标记样本,无法有效挖掘目标数据集的监督信息,使得最终的识别精度低。为此,本文提出一种低秩先验引导的域不变信息分离的字典学习方案。主要思想是根据同一视角下行人图像风格信息的低秩先验性,将行人图像特征中的风格信息和行人身份信息分离开来,从而减小因图像风格差异引起的域偏移问题。本文的主要贡献及创新点如下:(1)基于同一摄像机视角下行人图像成分风格的低秩先验性,提出了一种基于低秩成分分离的无监督域不变可扩展行人重识别字典学习方法。该方法不仅能有效缓解不同相机视角间域的偏移,还能有效降低被分离后行人身份特征的歧义性,避免行人标签信息的迁移。(2)本文将语义属性空间、潜在视觉特征空间以及源域中的行人身份标签关联起来,并利用语义属性的域不变特性,使源数据集学到的知识能够迁移到目标数据集中,从而提升字典的判别性。(3)本文加入了一种自训练策略来实现性能的提高,通过预测目标数据集中样本伪标签来调整和优化训练模型,从而进一步提升识别性能。(4)本文通过大量实验对算法进行验证,结果显示本文算法的性能在多个数据集上不仅超过了一些传统的基于字典学习的有监督行人重识别方法,还超过了部分基于深度学习的无监督域自适应行人重识别方法。
其他文献
阿尔茨海默症(Alzheimer’s Disease,AD)是最常见的神经退化疾病之一,严重危害患者的生命健康。核磁共振成像(Magnetic Resonance Imaging,MRI)和正电子发射计算机断层成像(Positron Emission Tomography,PET)可以分别提供大脑的结构与功能信息。国内外最新研究表明,结合同一受试者的MRI和PET图像将有助于提升AD辅助诊断的准确
车联网(Internet of Vehicles,IoVs)是物联网在智能交通领域的重要组成部分,利用车联网技术为车辆提供事故预警消息对于减少或避免次生事故的发生、提高交通安全具有重大意义,是当前车联网应用的研究热点之一。高速公路上由于车辆行驶速度快、车辆位置频繁变化等,导致车间信道条件差、传输不稳定,使得事故预警消息的分发面临严峻挑战。此外,将事故视频作为预警消息进行传播时,能够提供传统文本消息
行人重识别(Person Re-Identification,Re ID)旨在通过非重叠相机采集到的图像中找到与查询图像身份相同的行人,它通常也被认为是图像检索的子问题。近年来随着深度学习的兴起,行人重识别技术在智能监控、安防等领域得到广泛地发展及应用。现有的大多数行人重识别算法都是在同一数据集上进行有监督的训练后再测试,这类算法虽然性能较高,但是极大的限制了其可扩展性。在现实场景中,通常需要将训
海洋资源的开发利用是未来发展的战略重地,因为水下环境恶劣,人们通常借助水下机器人进行海洋探索,通过对水下视频和图像的研究分析,实现海底考古、海洋军事勘察、海洋牧场养殖、海洋环境监测、海洋生物保护等任务。水下拍摄环境复杂恶劣,大量噪声和失真的产生使拍摄的图像质量低下,导致关键特征信息丢失,因此如何获得高质量的水下图像显得尤为重要。为了获取高质量的水下图像,本文针对常见的自然光照下浅海图像和人工补充照
近几年,随着人工智能技术的广泛应用,句法分析等深层自然语言分析的关注度越来越高。句法分析的主要任务是分析一个句子的构成,并使其可以转化成句法树。通过句法分析,可以解析一个句子的构成词块,词与词之间的关系,从而帮助机器理解自然语言,并运用于机器翻译、自动问答、文摘生成等语义理解领域中。句法分析是自然语言处理的一个经典任务,本文主要研究汉语层次句法分析中的边界问题。首先通过剖析短语结构的层次句法分析的
古代石刻文献在我国历史文化研究中向来都是一项不可或缺的研究内容,具有重要的史料价值,但由于自然环境的侵蚀或是人为破坏,石刻文献的表面出现了若干大小不一、分布不均、形状多变的干扰区域,这不仅影响了人们的观感需求,而且对历史研究造成阻碍。信息化时代的来临,可将重要的石刻文献进行数字化储存以延长文物保存时间,也可通过网络共享的方式对石刻文献进行二次传播,打破时间地点的限制,增加古代历史文化的受众面,使用
芒果表皮缺陷检测是实现芒果的智能化采摘、果实质量分级的重要前提。基于卷积神经网络的计算机视觉技术为缺陷检测提供了可行有效的方法,是目前最为主流的检测方式。在自然环境下,光照的强弱、背景的复杂、果实枝叶茎干的相互遮挡等制约因素下,给芒果表皮缺陷的检测带来了巨大的挑战。采用深度卷积神经网络,可以提取更多的特征,具有更加实时精准的识别效果。因此,本研究采用基于语义分割、实例分割的方法研究自然环境下芒果表
图像融合的目标是将来自同一场景的多幅源图像的互补信息进行融合,生成高质量合成图像。红外图像反映的是目标在红外热辐射下的能量分布,不易受风沙烟雾等复杂条件影响,但其可视性并不是很理想,特别是物体纹理细节信息表现较差。可见光图像主要与目标场景的光反射有关,物体辨识度高,但容易受到外部环境的影响,特别是被遮挡时就无法准确地捕捉目标特征信息。所以,红外与可见光图像融合能够综合两种成像的优势,通过结合二者的
钢水碳含量终点预测作为转炉炼钢重要的一环,准确的预测将直接关系到炼钢效率,有利于减少能源和原材料浪费。由于熔池内不同比例的钢水碳含量能够反映在炉口火焰颜色、纹理形态等信息的变化上,因此采用炉口火焰图像特征提取的终点碳含量预测方法为传统预测提供一种新的参考,但火焰作为一种复杂变化的非结构对象,具有较强的随机性和相似性,给特征提取带来不小的困难,进而影响到终点预测的准确性。针对上述问题,本文将从钢水碳
转炉炼钢生产过程中,终点碳温的准确预报是钢铁产业至关重要的一环,而碳含量的准确预报对于提高钢铁冶炼工艺具有重要的意义。本文针对转炉终点炉口火焰图像相似性高,传统特征方法难以提取区分碳含量相近的火焰图像的关键特征,从炉口火焰图像的颜色特征和纹理特征提取入手开展研究,为提高基于炉口火焰图像特征提取的转炉炼钢终点碳含量预测准确率打下基础。本文的主要研究内容如下:(1)采用基于卷积神经网络火焰特征提取的终