基于深度学习和强化学习的目标跟踪算法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:qjw335471690
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标跟踪是计算机视觉领域的重要研究方向之一,在视频监控、智能机器人、无人驾驶、医疗诊断等多领域有广泛的应用。近几十年来,尽管目标跟踪算法已经取得诸多进展,但有些目标跟踪难题依然存在,例如:快速运动、运动模糊、背景混杂、目标形变、光照变化、目标出视野等。传统方法虽然计算效率和跟踪性能良好,但是由于手工设计特征的局限性,传统方法有时候并不能有效解决上述阻碍目标跟踪的问题。由于深度学习可以带来丰富的特征表示,强化学习可以将目标跟踪视为目标位置序列决策问题并学习好的跟踪策略,所以本文结合深度学习和强化学习对现有的目标跟踪算法进行研究学习,并提出了一些改进算法,主要工作内容如下:(1)提出一种基于注意力机制的改进ACT模型AACT。为了提高ACT模型在线跟踪时采用的分类器效果,本文引入DAT算法中的往复训练注意力机制,提出基于注意力机制的改进ACT模型AACT,借助往复训练方法,利用视觉注意力训练深度分类器,注意力图可以有选择性地关注时间鲁棒性特征,从而提高对目标的识别力。实验表明,这种往复训练注意力机制能够有效提高ACT算法的跟踪成功率,且针对背景干扰、形变、光照变化等问题表现优异。(2)提出了一种基于强化学习Actor-Critic帧间预定位的改进Siam RPN模型ACSiam RPN。由于Siam RPN模型搜索目标区域面积较小,模型有丢失目标的风险,为了提高跟踪准确率和成功率,本文融合前一帧和当前帧目标的帧间目标运动信息,扩大搜索区域为4倍目标边长,借鉴ACT算法利用强化学习方法Actor-Critic训练预定位网络,在更大的搜索区域单步计算目标位移,进一步校正Siam RPN搜索区域的中心。实验表明,本文提出的改进Siam RPN模型ACSiam RPN的跟踪准确率和成功率均超越了Siam RPN,运行速度65fps,仍然保持良好的实时性能,与当今一些较为先进的目标跟踪算法相比具有明显的优势。这种扩大搜索区域的基于强化学习方法训练的预定位网络可以有效提高Siam RPN模型的精确率和成功率,且在面对快速运动、运动模糊、光照变化和尺度变化等问题时表现出色。(3)提出了一种基于PWC-Net光流预测的改进Siam RPN算法PWCSiam RPN。为了提高Siam RPN模型跟踪准确率和成功率,本文采用4倍搜索策略,利用PWCNet光流预测网络引入光流信息,有助于预测目标前后帧的运动趋势,与此同时借助Ro IAlign获取前一帧目标外观特征,引入GIo U作为损失函数训练预定位网络,随后利用预定位结果来校正Siam RPN模型搜索区域中心。实验表明,PWCSiam RPN的跟踪准确率和成功率均超越了Siam RPN,且在面对快速运动、目标形变、目标出视野和尺度变化等问题时表现出色,运行速度20fps,接近实时性能。与当今较为先进的一些跟踪方法依然具有一定优势。此外,本文提出的各种Siam RPN改进模型及其变体的对比实验表明,扩大搜索区域、引入帧间运动信息和光流信息进行Siam RPN跟踪前的帧间预定位可以有效提高Siam RPN模型的跟踪效果。
其他文献
近年来,汽车数量的急剧增长使得交通事故的发生频率越来越高,给人民生命安全和社会经济发展造成了很大威胁。相关研究表明,驾驶员因素在交通事故发生的起因中占据主导地位,因此对驾驶员危险驾驶行为检测的相关技术进行研究具有重大的科研意义。本课题的主要目标是设计出一个监控驾驶员危险驾驶行为并实时预警的检测系统。论文在分析了国内外危险驾驶检测技术发展现状的基础上,研究并设计了一个基于机器视觉的危险驾驶行为检测系
科学技术的发明与创新是推动社会和经济发展的重要力量之一。企业或机构的研发人员为了在新技术的研发中取得领先地位,迫切需要准确地掌握技术发展脉络和预测技术发展趋势。一个可行的办法是对技术演化过程进行梳理并在此基础上激发创新点,进而形成新的研究方向。专利作为一种技术描述的承载物,为技术演化研究提供了重要的数据支撑,因此开展面向专利的技术演化分析方法研究是有意义和应用价值的。专利挖掘面临着诸多挑战,如涉及
将无线传感器网络(Wireless Sensor Network,WSN)应用到外界环境监测中,可以让传统的监测系统从有线传输变为无线传输,使得监测系统的布置变得更加灵活。但是,WSN中节点处理能力低下和自身携带电源有限等问题,一直没有行之有效的方法解决,特别是在图像处理与传输方面,这些问题更加严重。研究学者提出的压缩感知(Compressive Sensing,CS)理论,相异于传统的采样定律,
光学相干层析术(Optical Coherence Tomography,OCT)是一种新的生物医学成像技术,具有无损伤、高探测灵敏度以及高分辨率的特点。OCT利用宽带光源相干长度短的特点可以对散射组织进行高分辨率光学断层成像。本文研究了与微米分辨率谱域OCT成像系统研制有关的重要问题。首先,分析了谱域OCT系统成像原理,总结了系统各参数的计算方法,分析了影响系统轴向分辨率的主要因素。其次,搭建了
在医学显像诊疗领域,现有血管显像技术仅能实现单一波段浅层血管显像,难以获取三维立体视觉信息。本文研制出多光谱血管无创智能检测装置,提供深层血管的多光谱显像、获取三维视差数据的解决方案。主要研究工作如下:(1)在医学样本及其标注数据获取成本高的情况下,针对目前传统的血管提取算法在复杂纹理血管数据上泛化能力弱、基于深度学习的血管提取算法依赖过多数据且训练推理时效性不足的问题,建立了基于纹理抑制和细节增
高速CMOS相机能够捕捉并记录人眼无法分辨的物体高速运动过程,在许多场合都需要对高速瞬态过程进行记录并研究。近年来高速成像系统的发展迅速,但是仍然存在帧频慢,动态范围窄,信噪比低等问题,无法确保在不同的环境下都能获得较好的图像,因此,研究一款帧频快,动态范围大、信噪比高的高速CMOS相机是很有必要的。本文以美国LUXIMA公司生产的LUX1310数字图像传感器为研究对象,分析了该款传感器的性能条件
研究弹药爆炸时所产生火球温度对衡量弹药毁伤效能有重要的意义,通常会利用高温热电偶或红外热像仪对温度场进行测量。然而此类温度持续的时间短、温度变化剧烈、温度峰值高,红外热像仪较低的时间分辨率及热电偶较长的响应时间都令二者难以满足瞬态温度场的测量需求,同时此类温度场的产生一般都伴随着强烈的能量释放过程,测试环境复杂,容易对高温热电偶这类的接触式测温系统造成损伤,重复测量的能力相对较差。而高速成像技术具
在某些存在障碍物的场景下会存放如弹药之类的危险物品,以人力对这些物品进行搬运较为危险,而选择一种自主运输车对这些危险品进行操作能够极大程度上保证人员的安全。为实现运输车在这种场景下的自主运行,本文基于立体视觉技术,研究某移动平台避障导航系统,为这些场景下的物品运输提供了一种较为便捷且安全的方式。双目立体视觉技术具有低功耗、低成本、使用简便、易于维护升级等优点,基于此的研究有助于提高危险品运输效率且
随着车辆数目的增加,道路拥堵、碰撞事故等交通问题也随之增加,为此智能交通系统逐渐成为了解决交通问题的一个重要系统。该系统涉及多个子系统,组成庞大且复杂,其中地磁车辆检测技术为该系统的前端检测方式之一,是主要的基础核心部分。本文根据地磁车辆检测技术设计了基于PNI磁传感器的地磁车辆检测系统,并针对车辆对地球磁场产生的干扰特点,提出了基于自适应多阈值的有限状态机检测算法以及基于该算法下的车流量、车速以
血红细胞是血液中含量最高的血细胞,其出现的体积过大或者过小、形貌异化等特异性形态改变,是血液疾病、高血压和恶性肿瘤等多种疾病的症状之一。因此,通过对血红细胞,特别是微血管内的血红细胞进行形貌测量,可以为许多疾病的预防及诊断提供依据。如今对于微血管内的血红细胞测量多为透射电镜、血管造影等手段,这些方法需要借助荧光标记,从而对细胞造成不可逆的伤害。本文提出同步移相技术与透射式激光显微干涉技术相结合的相