基于视频序列的行人重识别算法研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:uestchujun
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着国家天网工程的建设和人民对公共安全的关心,行人重识别技术被广泛应用在视频监控,智慧安防,刑事侦查等领域。迫切的实际需求使得行人重识别技术发展迅猛,其中基于视频的行人重识别含有更丰富的语义信息和运动信息,逐渐受到更多研究者的关注。在针对表观特征学习的视频行人重识别研究中,将行人序列映射为单一的总体特征是其关键。平均池化或循环神经网络是最经典的聚合所有单帧特征的方法。但是,它们往往很难处理由遮挡,姿势变化和摄像头视角引起的空间不对齐问题。因此我们引入Non-local机制自适应学习序列内部的时空注意力。同时,我们使用特征擦除机制构建局部特征学习分支,使网络同时关注于全局特征和局部特征的学习,提升总体特征的判别性。基于Non-local和特征擦除的表观模型在大规模公开数据集MARS上MAP=81.9%,rank1=87.0%,与最先进的方法具有一定的可媲美性。此外,在实际应用中,现有的基于表观特征的方法处理行人换衣服等问题往往效果不佳。因此我们引入人体生物特征——步态作为辅助信息。我们提出的融合表观特征和步态特征的网络相对单一表观特征或者步态特征,在复杂场景具有更优越性的表现。特别在CASIA-B数据集CL(改变服装)子集上,显著提高了rank1指标,达到75.95%,超过单一步态或者表观特征20%以上。我们的融合网络中,实现了行人轮廓Mask的充分利用:一方面作为步态特征提取网络的输入,另一方面作为表观模型的空间注意力,用于构建前景表观特征分支。在Mask-MARS和CASIA-B数据集上,大量的消融实验验证了我们提出的融合网络的性能。
其他文献
近些年来,许多科研人员致力于电子设备创新交互方式的研究,并据此开发了众多人机交互应用。手势分类技术,作为人机交互方式中的重要一环,也逐渐成为了许多现实应用(如手势识别及可穿戴设备的视觉交互)的迫切需求,且应能适用于不同光照、背景等诸多环境。目前,许多现有的方法都能精确地识别手势,但是,在实际应用中依然存在着诸多的挑战,包括:环境的复杂性、不变量的不同性,例如处理时间、执行框架,以及系统的安全性、准
成像设备的抖动,元器件的噪声和图像编解码等都会导致图像退化。图像复原则是处理退化的图像,使其与原始图像更加接近。传统的图像复原方案有很多缺点,如计算时间过长,鲁棒性较差等等。近几年,基于神经网络的复原方法逐渐被提出,这种算法可以充分获取图像的先验知识,有效地提高图像处理速度,因此受到学者的广泛关注。然而现有的算法大多解决的是比较单一的图像降质问题。如在图像去模糊方面,仅解决人为制造的模糊核,而这类
心血管疾病日益成为世界首位死亡原因,治疗心血管疾病的投入很高。在防控心血管疾病上,平时的健康管理是必要的手段。由于防治指南无丰富、可操性的管控知识,但是健康网站上未经处理的管理知识也无法提供最有效的信息、可行性。不同来源的健康知识是否可靠,知识是否有理论依据,如何挖掘出更多的信息和科研方向均需要研究。因此如何将健康知识抽取关键信息、有效分类、挖掘并应用到实际中,是提高知识使用效率、指引科研方向等实
随着深度学习及与其相关的动作识别技术的兴起,电子设备在此过程中逐渐展现出其独特的功能性。目前,这已成为计算机视觉的主流研究方向之一,并且在人机交互领域彰显出巨大的潜力。然而,在实现过程中,可能会遇到与诸如计算代价和效率等相关的各项挑战。同时,人体动作识别又是一个极为复杂的领域,因为图像序列可能会包含一系列不属于特定动作的多样化特征。为了解决上述问题,本研究提出了一种基于DTA技术(Detect、T
飞行员在环数值仿真系统是验证民机功能设计、研究航空人为因素的重要工具。随着民机自动化水平的提高,飞行员与飞机自动化系统之间功能分配设计的合理性是保障飞行安全的重要前提。为保证从仿真模型开发到飞机系统设计的无缝衔接,需围绕飞行员在环仿真系统建立合理的设计流程,并对民机系统设计中的人机功能分配问题建立有效的评价机制。本文的研究内容主要包括:引入基于模型的系统工程方法从而建立飞行员在环数值仿真系统从飞机
随着市场竞争的不断加剧,企业必须根据外部市场的变化,通过提高内部管理水平,加强管理管控,以提升自身的市场竞争力,保证战略目标及经营目标的实现。全面预算管理是实现企业经营目标的重要管控手段和保障之一。作为企业战略规划及经营计划的量化工具,全面预算管理在企业管理中得到广泛应用。但如何有效进行全面预算管理,则是所有企业均需面对的问题。本文将根据全面预算管理在企业经营目标实现中的作用以及大多数企业目前运用
随着技术的发展进步,显示设备的性能逐步提高,除了分辨率和色彩丰富度的提高,也表现在刷新率的显著提高。而电子显示屏显示动态影像的原理与人眼的视觉融合及视觉暂留效应是紧密联系的,当快速变化的静态图像达到一定的变化频率,人眼看到的画面就会产生动态感,这个频率在通常情况下是60Hz左右。目前的高端商业显示器的刷新率已经可以达到144Hz甚至更高,而更高的刷新率除了可以给观看者带来比以往更流畅的观看体验之外
场景的三维重建技术是计算机视觉和定位导航的重要研究课题,使用该技术可以获得物体的3D轮廓,也能获取轮廓上任意点的坐标。随着视觉导航技术的不断发展,人们对使用计算机模拟现实世界的三维场景越来越感兴趣,对三维重建技术的要求越来越高。基于单幅图像的三维重建是三维重建中一个重要的研究方向,重建过程中的主要困难是信息的不充分性,但由于其重建效率高、成本低廉,在虚拟现实、大型场景重建、城市数字化和文物恢复等领
咬肌肥大是指单侧或双侧咬肌的无症状扩大,通常会导致方形的下颌面轮廓,在亚洲人的审美中一般认为这是不美观的。在人们对美的要求普遍越来越高的今天,针对咬肌的A型肉毒杆菌毒素(BoNT-A)注射疗法由于它的低侵入性以及对咬肌肥大良好的治疗效果已经在亚洲得到了广泛的临床应用。然而,如今主流的BoNT-A咬肌注射技术基本是从临床实践中总结而来,尚未有研究基于解剖结构信息对咬肌注射技术进行统计学上可信的定量评
民营航空行业的IT信息化系统相对比较传统。但对于安全性和稳定性的要求非常高以至于航空行业的系统架构变化很小。很多企业仍然沿用着许多年前的技术方案。而当今人们对出行的需求日益旺盛,也更加注重出行效率和出行体验。用户的需求变化快、种类多,这种现状就要求公司要有快速、高效的软件交付能力用以支撑业务的快速发展。目前单体架构模式的系统已经成为了业务持续增长的瓶颈。从提出需求到最终上线往往需要耗费大量的时间,