【摘 要】
:
行人再识别技术因其在智慧城市、刑侦等领域里面存在巨大的应用价值而成为计算机视觉任务里面一个研究热点领域。行人再识别,指的是在一组多摄像头网络中,运用一系列图像处理和模式识别技术,判别无重叠的视频监控系统下的行人是否为同一个行人。因室外场景中,摄像头角度不统一、行人姿态多变、行人背景复杂、室外光照多变、行人受到遮挡等因素,现如今的行人再识别技术难以在室外真实场景中部署。针对以上存在的问题,本课题开展
【基金项目】
:
2018年广东省重点领域研发计划项目:面向公共安全的目标追踪与身份识别关键技术研究与应用(2018B010108006);
论文部分内容阅读
行人再识别技术因其在智慧城市、刑侦等领域里面存在巨大的应用价值而成为计算机视觉任务里面一个研究热点领域。行人再识别,指的是在一组多摄像头网络中,运用一系列图像处理和模式识别技术,判别无重叠的视频监控系统下的行人是否为同一个行人。因室外场景中,摄像头角度不统一、行人姿态多变、行人背景复杂、室外光照多变、行人受到遮挡等因素,现如今的行人再识别技术难以在室外真实场景中部署。针对以上存在的问题,本课题开展了以下的工作:(1)针对室外光照变化大、行人背景复杂、行人遮挡问题。首先设计一种基于灰度值的亮度评估算法,将MSMT17数据集中的光照过亮和过暗的图片挑选出来,再使用光照补偿算法和光照削减算法分别对过暗图片进行亮度增强,对过亮图片进行亮度削减,达到使行人图片光照尽可能保持一致的目的。其次,通过Grid Mask补偿训练集中遮挡的样本;通过Mosaic增强技术增加行人数据集的背景复杂性;设计了针对现实场景中光线通过树影光斑的非均匀光照图像增强技术,增加了行人再识别数据集中非均匀光斑的行人图像样本。实验表明提出的光照自适应算法能够很好的调整亮度过暗和过亮的图片,三种图像增强技术也能够增加数据集的多样性。(2)针对因室外行人姿态异常、背景遮挡而导致的待检测行人与行人模板图像差距大的问题。利用人体姿态关节点置信度判断人体局部被遮挡情况,在行人图像特征提取时给被遮挡的区域赋予较低的权值,给未被遮挡的区域赋予较高的权值,降低了人体被遮挡区域图像特征的干扰。根据人体姿态关节点之间的夹角、相对距离、位置关系,计算出局部图像旋转角度,对姿态异常的部分进行角度的旋转,经过图像拼接,得到较为接近训练数据中正常的行人姿态,完成了姿态异常的矫正。(3)针对室外光照多变、行人姿态异常问题,设计基IBN归一化的行人图像矫正网络和基于STN网络的行人特征空间变换模块,引入Mish激活函数,构建基于IBN和STN的改进ResNet特征提取骨干网络。在训练阶段,使用(1)中的Grid Mask图像增强、Mosaic图像增强技术和非均匀光斑图像增强增加数据集的多样性,在三个数据集Market-1501、MSMT17、Duke MTMC上的Rank-1达到95.2%、77%、88.1%,和现有的行人再识别算法对比具有一定的竞争力。在测试阶段,使用(1)、(2)中算法对光照多变、姿态异常、行人遮挡情况进行处理,最终的综合对比实验显示算法在MSMT17上Rank-1和m AP达到79.8%和58.5%。
其他文献
图数据是一种由顶点和边构成的抽象的数据结构。随着信息科学技术时代的发展,研究人员发现图数据有强大的表示能力,可以对许多不同的领域里拥有复杂结构的数据进行建模,例如,生物信息学中的DNA、蛋白质,化学信息学中的化合物,计算机科学中的社交网络、知识图谱。如何对图数据进行分类成为研究的热点。在部分实际应用中,我们只能标记一部分图数据为正类,其他实例都未能作标记,这被叫做正类和无标记的(PU)图数据分类问
高光谱图像包含丰富的光谱信息和空间信息,它可以更细腻地描述地物特征,因此被广泛应用于农业,环境检测,军事,地质等领域。然而,根据这几年研究表明,高光谱图像分类算法的研究还是有很多挑战,如高光谱的每个像素点的数据结构非常复杂,数据维度非常大,在有限的样本情况下实现高精度的分类和时间耗费较少是非常困难的;高光谱图像信息比较丰富,未能充分利用高光谱图像的不同空间信息;提取的图像特征未能进行很好的融合;高
分布式能源技术的不断发展,使可再生能源将以更加分散的形式出现于各个住宅中,比如可再生能源的产生和存储(如光伏屋顶),因此基于家庭的电能系统将成为未来电力系统的重要组成部分。家庭内部的电能系统也越来越被重视,它的研究有利于家庭能源的合理使用,既能满足外部电力系统稳定运行的需求,又能减少家庭用户的电费支出。家庭能源管理系统中的关键便是对家庭负荷的精准预测,为了更准确的对家庭电能负荷进行调度,单个用户级
中医的智能化主要通过硬件设备代替医生对病人进行“望闻问切”,从而得到诊断结果。但硬件识别与人眼识别存在差异,导致采集的数据会受到各种因素的影响。如何对采集到的数据进行优化,减少因各种原因造成的差异,是当前中医智能化所要解决的重要问题。为此,针对开放环境下的望诊图像采集过程中各类问题,本文创新地提出了一种望诊图像采集和处理方法及服务系统,旨在为训练集提供标准化的数据。论文的主要研究内容和创新点如下:
阻塞性睡眠呼吸暂停综合征(Obstructive Sleep Apnea Syndrome,OSAS)是一种流行的且与睡眠有关的呼吸系统疾病。它的主要表现为睡眠期间上呼吸道重复地发生部分或完全阻塞。在本研究中,我们使用OSAS患者清醒时的语音信号,来检测OSAS的严重程度。当前,基于语音的OSAS检测方法使用传统语音特征。传统特征集一般使用梅尔频率倒谱系数(MFCC)、共振峰、能量、线性预测编码(
随网络的进步与普及,社交媒体已成为越来越多人获取信息的平台。虽然人们可以从社交媒体中便利中受益,但它也带来了一些问题,其中最为显著的是谣言泛滥问题。谣言给人们的生活带来了许多负面影响,虽然当前有人工谣言检测平台,但人工检测难以及时应对庞大的网络数据。因此自动谣言检测受到越来越多的关注,自动谣言检测研究变得至关重要。虽然已有不少工作做出了杰出贡献,特别是以神经网络为基础的集成学习方法取得了优异表现,
肝胆管结石病是外科的常见病、多发病,是造成良性胆道疾病死亡的主要原因,微创外科取石手术是其重要的治疗手段。手术成功很大程度上依赖于术前有经验的医生对CT图像中的胆管及胆结石进行人工判别和定位标记。然而,这项工作耗时耗力,对医师的要求较高,且结果的客观性因主观经验有所差异。因此,实现对CT序列图像中的胆管及胆结石的自动化精准分割具有重要的临床应用和研究价值。当前有关胆管及胆结石分割的方法表现一般,主
心脏病一直以来都是全球死亡病例的主要死因,因此,对心脏疾病的研究分析一直以来都是医学领域的研究热点。由于人眼无法直接看到心脏内部的电生理活动,因此需要借助心电图,将心脏内部的电生理活动转换成图形表示出来。医护人员在对病人的心脏情况进行判断时,主要的依据是病人心电图上波形的幅度以及波形之间的时间间隔等生理信息。所以如何从ECG中读取到足够多的有用信息来进行诊断是本领域的技术难点。由于采集到的心脏内部
纽扣电池作为我们的日常生活必需品,每天都有极大的消耗量和生产量。在纽扣电池的生产过程中,其外观的缺陷检测是一道严格且必备的工序,然而这道工序在一些作业现场仍然是通过人工肉眼的方式来进行挑拣,由于大量的重复工作会导致工作人员的视觉疲劳,缺陷品的漏检和错检现象常有发生,这必然会带来企业的产品品质问题。为了实现这道工序的自动化分拣,本文提出了基于机器视觉和并联机器人的纽扣电池分拣系统。以下为本论文涉及的
随着物联网技术、无线通信技术的快速发展,众多车联网相关应用层出不穷,例如无人驾驶、智能辅助驾驶等。上述应用均具有:计算任务量大、计算时延短等特点。然而,单个车辆自身的计算资源受限,可能无法满足上述新兴应用需求,使其难以保障所需的车联网用户的服务质量。将移动边缘计算技术引入到车联网,构建边缘车联网,通过在无线接入网络的边缘以及靠近移动用户的位置提供计算资源以应对各类应用,具有增强车辆计算性能的巨大潜