【摘 要】
:
首先,本文提出一种新的基于相关滤波以及深度孪生网络的鲁棒长程视频跟踪算法。该算法能有效对长视频中存在的目标长时间遮挡、快速运动、消失视野等挑战进行处理。当目标经历长时间遮挡又重新出现在视频中时,本文所提算法通过离线训练好的深度孪生网络,使用模板相似度匹配来进行目标的重检测,从而得到高质量的目标候选区域。为了筛选得到正确的目标区域,本文提出了一种有效的多专家评估机制,来筛选得到置信度最高的目标区域。
论文部分内容阅读
首先,本文提出一种新的基于相关滤波以及深度孪生网络的鲁棒长程视频跟踪算法。该算法能有效对长视频中存在的目标长时间遮挡、快速运动、消失视野等挑战进行处理。当目标经历长时间遮挡又重新出现在视频中时,本文所提算法通过离线训练好的深度孪生网络,使用模板相似度匹配来进行目标的重检测,从而得到高质量的目标候选区域。为了筛选得到正确的目标区域,本文提出了一种有效的多专家评估机制,来筛选得到置信度最高的目标区域。本文所提出的长程视频跟踪算法在当前几个主流的跟踪数据集上均取得了较为优异的跟踪结果。其次,针对基于相关滤波的深度视频跟踪算法所使用的深度特征复杂度高,针对性不强等问题,本文提出了一种基于深浅层特征学习网络(Deep and Shallow feature learning Network,简称DSNet)的高效视频跟踪算法。该特征学习网络能同时编码目标浅层以及深层信息,以端到端的形式学习得到统一分辨率且低维的特征。学习得到的特征能有效应用在当前任意基于相关滤波的视频跟踪框架中,且无需进行任何在线的微调或改变。此外,基于目标区域关于背景区域在特征图上的激活比,本文提出了特征通道置信度评价方法(Channel Reliability Measurement,CRM)。基于CRM的特征选择,跟踪算法可以得到并使用更为紧凑且鲁棒的目标跟踪特征。实验结果表明所提出的特征学习方式不仅能显著提升当前主流的基于相关滤波的深度视频跟踪算法的精度,而且能有效提升跟踪速度。然后,由于传统的基于分类的深度视频跟踪算法采用在线采样、在线训练等策略,其过高的计算复杂度导致此类算法往往难以实时运行。针对此问题,本文提出了一种新的基于多分支自编码对抗网络的高效视频跟踪算法。与传统上述方法不同,所提出的方法将视频跟踪任务考虑为一个目标概率分布生成问题。具体来说,本文提出了一个可以融合多层特征信息的轻量级生成网络。通过采用对抗训练,生成网络能学习到更具有判别力的特征表达。在跟踪过程中,给定目标模板和搜索区域,生成网络能通过单次前向计算准确估计目标概率分布,从而完成单次跟踪。所提出的跟踪算法不仅能在单GPU平台上达到200+FPS的跟踪速度,而且在UAV20L数据集上取得了比MDNet跟踪算法更好的跟踪精度(57.2%)。最后,本文提出了一种新的基于幻觉对抗网络的深度视频跟踪算法。该算法旨在于模仿人类的想象机制,来生成多样的在线目标训练样本,从而缓解传统的基于卷积神经网络的跟踪算法在跟踪过程中发生的过拟合问题。具体来说,本文首先提出了一种通用的幻觉对抗网络,来学习样本对间的非线性形变。然后,本文提出一种新的形变重构损失,使得所提出的幻觉对抗网络可以通过自监督的方式来进行有效训练。为了使迁移的形变能动态适应于当前视频跟踪任务中的目标,本文提出一种新的选择性形变迁移方法。基于所提出的幻觉对抗网络,本文提出一种新的幻觉对抗跟踪算法(Hallucinated Adversarial Tracker,HAT),本文所提出的HAT算法在OTB-2013、OTB-2015和VOT-2016数据集上均取得了较为出色的结果。尤其在OTB-2013数据集上,所提出的HAT算法取到了当前最佳的精度结果(95.1%)。
其他文献
全息术用作一种成像技术,能够完整地记录物体的波前信息,实现了真正的物体三维成像。数字全息术通过将传统的光学全息与计算机图像处理技术相结合,可以方便准确地进行全息图
伴随我国经济社会的发展,各行业规模逐渐扩大,因此对人才需求规模逐年增长。目前对教育需求巨大,己有的教育资源无法满足居民对教育的需求,民办教育在我国教育发展中承担着越来越多的教育任务。在此背景之下,职业院校的发展,特别是民办职业院校的发展进入了机遇与挑战并行的时代。但是民办职业教育在发展中仍然存在很多问题,作为具备企业与高等教育机构双重属性的存在,其发展需求和管理运行均存在一定的特殊性。只有解决了这
在多标签学习中,一个样本同时具有多个标签,如一张图片同时拥有“海洋”和“帆船”的标签。然而,在现有多标签学习方法中,多数方法仅仅考虑数据集中标签之间的依赖关系(局部标签相关性)或只考虑标签之间的语义相似度(全局标签相关性)。事实上在多标签学习中,样本具有多个标签,而且局部和全局的标签相关性同时作用于实际应用,不应该局限于考虑成对标签的相关性,而忽略标签之间的高阶相关性。因此,本文提出一种新颖和有效
由于经济朝着全球化的发展趋势前进,导致经典模式的制造型企业变得越来越大,产品的款式也是越来越多,同时也就会更加复杂,所以,对于经典模式的企业来说也是面临着非常严峻的挑战。对于生产制造型企业来说,影响制造企业最关键的一点就是车间调度问题,公司在解决资源的分配问题时也需要要用车间调度问题来解决的,因此这已经是重点要研究的问题。对于车间的生产方案怎么去安排,会对企业的发展有很大的影响。在本篇文章中,通过
软件老化(Software Aging)指系统在长时间运行过程中,由于错误的积累导致系统性能逐步下降并最终可能导致系统崩溃的现象。软件恢复(Software Rejuvenation)是指一个需要成本
教研活动是教师进行教学改革、提高教学水平、增进同事交流、提高学生学习效果的重要方式。教研活动开展的方式多样,既有学校组织的教研活动,也有教师自发进行开展的,当下占主导地位的是学校组织的教研活动。小学教师教研活动普遍面临着效率低下、形式主义及知行分离等问题,既占用了教师大量的课余时间,又难以达到预期效果。同样存在这一困境的W小学希望能够通过变革现有的教研活动模式,调动教师的积极性,发挥教师作用,保证
可溶液加工的有机小分子半导体材料具有分子结构明确、空气稳定、易提纯以及性能优异等优点,成为有机电子学研究的热点之一,特别是基于吡咯并吡咯二酮(DPP)的半导体材料引起了
聚类分析是模式识别与数据挖掘等诸多领域的重要技术之一。然而,由于簇的大小、形状、分布各异,目前已有的聚类算法,包括划分式、层次式、基于密度峰值和基于最小生成树等方法都无法令人满意。大量研究发现,相比均值中心和密度中心,使用代表点作为聚类中心的方法具有较好的性能,该方法受噪声、离群点和簇的形状的影响较小。另外,最小生成树的形状并不会随簇边界的变化而变化,因此,基于最小生成树的聚类算法能解决对簇的形状
本论文选题为“H职业学院的组织文化建设研究”,研究对象是H职业学院,简称“H学院”,研究内容是组织文化建设。因此,本文从H学院组织文化建设的实际情况出发,以北大光华的组
单张图像超分辨率(Single Image Super-Resolution,SISR)重建是当今人工智能、计算机视觉等学科的重要研究课题,自上世纪七十年代以来便受到了学术界和工业界的广泛关注。它的主要任务是:给定一张低分辨率的图片,复原出一张高分辨率的图片。高分辨率图像相对于低分辨率图像一般拥有更多的像素密度和纹理细节。该任务在当今社会有许多重要的应用场景:图像压缩领域,医学成像领域,遥感成像领