单目标联合跟踪与分割算法研究与应用

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:guofeng7303
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉目标跟踪(Visual Object Tracking)旨在对视频任意目标进行轨迹追踪,是计算机视觉领域中基础研究方向。目标跟踪技术在自动驾驶、机器视觉、智能监控、军事国防等领域得到了广泛应用。深度学习技术的发展大幅提高了目标跟踪算法的性能,但在应对相似目标干扰、非刚性形变、尺度变化剧烈挑战时,依然存在鲁棒性差、准确性低的难题,无法满足实际应用场景的需求。本文基于深度学习技术,提出两种基于多任务的视觉目标跟踪算法,将分割思想引入跟踪算法。在目标跟踪任务中,为缓解跟踪器漂移、准确性低的问题,提出一种基于区域中心距离加权重叠度估计的目标跟踪算法;为进一步提升目标跟踪算法的稳定性和准确性,提出一种基于双路滤波融合定位的跟踪算法。具体研究如下:基于区域中心距离加权重叠度估计的跟踪算法将跟踪任务分解为三个子任务:目标定位、尺度估计和目标分割。在目标定位任务中,利用相关滤波算法(Correlation Filters)进行定位;在尺度估计任务中,同时将区域中心距离(Distance)和区域重叠度(IOU)作为评价动态锚框(Dynamic Anchor)质量的指标,筛选出更有利于跟踪任务的目标矩形框;目标分割任务中,将分割思想融入跟踪框架,实现在跟踪的同时获得目标精细分割掩膜(Mask),利用分割方法提升跟踪的性能,通过端到端多任务学习的方式实现对目标准确的跟踪。在权威测试集VOT2018和OTB100上进行了充分实验对比,所提算法在VOT2018数据集上的平均期望重叠率(EAO)指标达到0.459,相对2019年最佳算法Di MP提升2.0个百分点;鲁棒性指标达到0.169,准确性指标达到0.617;在OTB100上的成功率指标达到0.677,精度指标达到0.872,所提方法具有较强竞争力;将其应用在无人机红外目标跟踪任务中,与Siam Mask(CVPR2019)算法相比,性能更加显著。为进一步降低前述所提算法的冗余,提高算法鲁棒性和精度,提出一种基于双路滤波融合定位的跟踪算法。将目标跟踪过程简化为两个子任务:目标定位与分割,移除了尺度估计网络分支。在目标定位中,提出由两路独立的相关滤波器进行融合定位,能够克服相似目标干扰问题,相比单路具有更高容错性,能有效提升定位鲁棒性;在目标分割中,利用基于特征调制的编解码分割网络,结合目标定位注意力信息,能够直接输出目标精细分割掩膜,在提升跟踪准确性的同时,避免了矩形框回归分支带来的计算冗余。所提算法在公开测试数据集VOT2018、VOT2019和GOT10k上进行了充分实验,在VOT2018数据集上的平均期望重叠率EAO指标达到0.467,相对性能最佳的算法Di MP(ICCV2019)提高了2.7个百分点;在VOT2019数据集上EAO指标达到0.334;在GOT10K数据集上平均重叠(Average overlap)达到60.0;与先进算法进行对比,双路滤波融合定位跟踪算法具有较强的竞争力。
其他文献
目标跟踪是计算机视觉领域里的一个研究热点,并广泛应用于视频监控、交通、人机交互等生活领域中。近年来,跟踪算法的性能不断提升,但是在面临复杂场景时,设计一个高鲁棒性的跟踪模型仍然是个难题。针对传统跟踪算法存在的不足,本文在相关滤波框架的基础上进行了以下一些研究:针对传统相关滤波跟踪方法的空间正则化权重与目标内容无关和跟踪过程中模型发生退化等问题,提出一种基于时间感知和自适应空间正则化的目标跟踪算法。
随着社会电子产品需求量的剧增,对于PCB焊接流程工艺的要求不断提高,但是PCB焊接流程中的定位支撑工作仍然需要人工完成,这样既增加了人工成本,又提高了人为误差风险,针对此问题本文提出了基于机器视觉的PCB板定位支撑系统的课题,致力于用机械取代人工。首先,本文介绍了选题的意义及目的,阐述了机器视觉的国内外发展现状。针对PCB板的识别定位系统设计问题,设计了总体系统的软硬件。其次,为了解决系统中视觉标
人脸年龄合成是研究某个人过去和未来相貌的一门技术,这项技术在现实生活中有很广泛的应用,例如寻找失踪人口,影视娱乐,公益项目宣传等。但众所周知,人脸图片中包含很多重要信息,如:性别、表情、身份、年龄等,如何获取这些信息以及如何保留更多的有效个人面部信息,使生成的图片更像本人值得深入研究。此外,由于数据稀缺,人脸年龄合成领域的研究始终面临巨大的挑战,如何解决数据稀缺的问题也值得深入探讨。针对上述问题,
协同目标分割是一种对多张相关图片中的共同类别物体进行分割的技术,其着眼于多张图片中的共性特征,挖掘同类别图像间的共同模式,在计算机视觉领域有着广泛的应用场景。传统方法大多根据图像的明暗、色彩或者手工设计的边缘特征对不同的区域聚类,受制于有限的特征表示能力,在图像模糊、不均匀光照等复杂场景下难以实现正确分割。近年来深度学习的兴起,基于卷积神经网络的算法凭借海量数据和强大的特征表示能力,在性能上大幅领
上世纪60年代兴起的气象卫星是气象探测研究和业务中的重要突破,其提供的连续的高时空分辨率云图数据是以往常规探测技术无法比拟的。卫星云图可以作为日常天气分析和预报辅助工具,对于卫星云图的解译和使用,是天气预报工作不可分割的组成部分。当前气象卫星云图研究和应用中目视判读仍是主要手段之一,主观因素导致无法完全提取和最大化利用卫星云图中的有效信息,并且妨碍了定量化和自动化预报的发展。随着国产气象卫星技术的
随着大数据时代的到来,图像、视频等大量高维数据在获取、存储的过程中,不可避免地出现获取的数据是残缺不全的、含有大量噪声等现象,这会使数据的分析受到极大的影响,如何将残缺的数据补全或者从噪声中恢复干净的数据成为了数据处理的重要问题。近年来,低秩模型引起了学术界的广泛关注。由于图像、视频等高维数据的内部结构、前后帧之间往往有较强的相关性,可以在低维空间对其进行表示,因此基于低秩学习的张量补全和恢复的模
腺癌是一种常发生于上皮腺体组织的癌症类型,在结直肠癌、前列腺癌、乳腺癌、肺癌等多种恶性肿瘤中都十分常见。在病理形态上,腺癌的发生往往伴随着腺体结构分化变差甚至不分化,即腺体组织呈现出异常变形扭曲、内部空腔结构被细胞核侵占致其缩小甚至消失。这种不同程度的腺体分化直接与腺癌的恶性程度相关联。因此,在临床病理诊断中,腺体组织结构的分化程度是病理学家确定腺癌等级乃至决策治疗方案的决定性因素。为了实现腺癌恶
2D人体姿态估计的研究目标是准确检测并定位图片中人体的所有关键点,例如,膝盖,脚踝等,是当前计算机视觉领域的一个研究热点。近年来,尽管基于深度学习的人体姿态估计模型取得了较大进展,但大多数工作均聚焦于人体关键点的检测,忽视了肢体之间的关联。鉴于人体物理结构的整体性质,本文从关键点的相关性来建模学习人体姿态估计特征,主要研究工作如下:(1)提出基于期望最大化的人体姿态估计网络(Expectation
乳腺癌是女性发病率和死亡率最高的恶性肿瘤,新辅助化疗是治疗乳腺癌的有效手段,有利于缩小肿瘤、降低肿瘤分期,将无法手术的肿瘤转化成可手术的肿瘤,提高患者无病生存率。临床医生根据自身经验以及患者的分子分型预估患者是否需要进行新辅助化疗,主观性较强且无法针对单一患者准确预测其化疗后的病理缓解程度,易导致化疗无效后患者错过最佳治疗时机。因此,本文旨在利用计算机图像处理技术对乳腺癌患者新辅助化疗前的全景穿刺
图像复原技术随着数字技术的发展,已被广泛应用于多个领域,是图像处理领域中一个重要的研究方向。传统图像复原方法如逆滤波法、维纳滤波法、最小二乘法等难以解决函数逼近问题,难以应用于复杂场景。本文主要使用生成对抗网络实现图像超分辨率重建和图像修复两方面的复原任务。图像超分辨率重建在预处理时会出现丢失部分图像重要的高频细节,重建图像过于光滑以及网络模型训练不稳定等问题。图像修复过程中存在受伪像影响、修复结