【摘 要】
:
近年来,在计算机视觉领域,视觉目标跟踪技术日益成为研究热点。基于相关滤波的目标跟踪算法在满足跟踪实时性要求的同时,跟踪性能也表现优异,因而在视觉目标跟踪领域受到了广泛关注。然而,此类算法在复杂多变的跟踪场景下,仍面临诸多挑战。本文针对复杂场景中的挑战因素,在相关滤波跟踪框架的基础上提出了两种改进算法,有效提高了算法在背景混乱、大范围形变、遮挡和旋转等复杂场景下的鲁棒性。本文的研究成果和主要贡献如下
论文部分内容阅读
近年来,在计算机视觉领域,视觉目标跟踪技术日益成为研究热点。基于相关滤波的目标跟踪算法在满足跟踪实时性要求的同时,跟踪性能也表现优异,因而在视觉目标跟踪领域受到了广泛关注。然而,此类算法在复杂多变的跟踪场景下,仍面临诸多挑战。本文针对复杂场景中的挑战因素,在相关滤波跟踪框架的基础上提出了两种改进算法,有效提高了算法在背景混乱、大范围形变、遮挡和旋转等复杂场景下的鲁棒性。本文的研究成果和主要贡献如下:1.提出了一种自适应上下文感知相关滤波类目标跟踪算法。传统的相关滤波类目标跟踪算法由于余弦窗和搜索区域的限制,导致滤波模板学习到的目标周围的的背景信息过少,在大范围形变和复杂背景干扰的场景下,容易产生跟踪漂移。上下文感知算法中提出了一个框架允许将全局上下文信息纳入相关滤波跟踪器,但其没有具体计算全局上下文信息对目标的干扰程度而直接采用相同的抑制权重,无法对干扰程度不同的背景信息自适应赋予不同程度的抑制。为此,本文对传统相关滤波类目标跟踪算法做了以下改进:(1)将目标上下文背景信息训练到滤波器中,提升滤波器模板对于目标和上下文背景信息的分类能力;(2)提出一个上下文信息干扰系数公式,用于定量评估目标上下文信息对于目标的干扰程度;(3)引入一个自适应权重系数向量,作为上下文背景区域的抑制系数,同时基于上下文信息干扰系数公式计算的结果,实现上下文区域与自适应权重系数向量的匹配,从而使得对目标干扰程度越大的上下文信息,被抑制的程度越大。最后,在目标跟踪标准数据集上对算法性能进行验证,结果表明提出算法的跟踪成功率和精确度较基准算法分别提升了5.7%和4.3%,同时对复杂背景干扰和大范围形变等跟踪难点问题具有较强的鲁棒性。2.提出了一种融合光流估计的相关滤波类目标跟踪算法。目前主流相关滤波类目标跟踪算法提取的HOG或CN等模板类特征对旋转和变形较为敏感,且每帧固定学习率的更新策略容易引起模型退化问题。为此,本文结合局部角点在运动目标发生尺度、旋转变化或是被遮挡时仍能被准确检测到的特性,对主流相关滤波类目标跟踪算法做了以下改进:(1)提取感兴趣区域的HOG特征作为相关滤波跟踪模型的特征输入,然后基于响应检测模块,对每帧图像的响应结果进行置信度检测,当判定跟踪置信度较低时,则开启基于Harris角点特征的光流估计模型,并将其和相关滤波模型的输出偏移量进行融合,使得模板类特征和局部角点特征优势互补,从而确定最优的跟踪位置,反之,则仅采用效率高的相关滤波模型;(2)提出一种模板自适应学习率调整方案,根据当前帧的跟踪结果有选择的调整学习率,以解决模板退化问题。最后,在目标跟踪标准数据集上对算法性能进行验证,结果表明相较于基准算法,提出算法在遮挡场景下的跟踪成功率提升了6%,在旋转场景下的跟踪成功率提升了3.4%,在形变场景下的跟踪成功率提升了2.9%。
其他文献
近来,伴随着以Deepfake为代表的人工智能视频合成伪造技术取得的一系列成果,我们正在进入一个难以分辨真假图像的世界。人脸合成、面部身份互换、面部属性伪造和面部表情伪造四种人脸伪造技术正在广泛应用于视频类消费娱乐领域,但同时也在为虚假色情、假新闻、恶作剧和金融欺诈等方向不断提供支撑。伪造技术的各类负面应用引发广泛的社会担忧,检测假脸成为了学术界的热点问题。伪造检测领域中,深度学习已经成为在检测D
随着深度学习的发展,大规模的遥感影像和自然影像数据集让图像分割算法在更多领域得到应用,但是样本的多样性也给分割算法带来了一定的挑战,其中如何解决跨尺度特征融合以及多尺度目标分割一直都是学术研究的热点。考虑到现有基于深度学习的图像分割算法存在的问题,本文针对目标分割的难点,从特征提取网络、高分辨图像恢复、几何特征学习等方面提出了改进方法。主要研究内容如下:1、提出一种基于自适应提升小波融合网络的多尺
聚类算法是指根据数据的关联性,将相似数据划分至相同数据簇,而将相异数据划分至不同数据簇的过程。随着计算机深入到人们日常生活中,互联网上每天都会产出海量的数据,但这些数据大多数是不包含标签的。给这些海量数据做人工标注非常耗时费力,所以目前较为成熟的有监督学习算法面临着训练数据匮乏的问题。因此使用无监督学习中的聚类算法,根据样本之间的相似性对其自动分组具有非常重要的研究意义。传统的聚类算法只能提取数据
正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)作为一种多载波调制技术,凭借高频谱效率与抗多径干扰能力等特点,在线性时不变信道中的性能优异。然而,OFDM在高多普勒扩展的时变信道(如高速铁路移动通信)中的性能会急速下降。正交时频空(Orthogonal Time-Frequency Space,OTFS)在高多普勒扩展信道中,其每个发送
自然语言理解的研究是目前人工智能领域的热点之一,以此为核心的技术突破与相关模型的落地实现也层出不穷。目前,深度学习在工业产品订制中的应用尚未推广开,随着智能制造的兴起与互联网技术的进步,未来借助自然语言理解实现用户产品个性化推荐必将迎来更大的市场空间。为用户提供更好的个性化推荐,关键是要准确了解用户的偏好特征。计算机在理解用户偏好时首先要解决的是自然语言理解中出现的歧义问题。本文通过分析国内外自然
近年来,煤矿托管运营模式逐渐发展成为一种新型煤矿生产组织模式,其特点是把煤矿企业的所有权与经营权剥离,将中小型煤矿委托给生产经验丰富、管理团队专业、技术水平高、社会资源充足的专业化运营公司,解决了煤矿企业传统经营模式下人员素质低、技术力量薄弱及安全风险管控不足的问题。随着国家对托管运营模式的推广应用,出现了一系列风险管理问题,例如委托方与被委托方财务管理纠纷不断、安全事故频发等,反映出煤矿企业对托
认知雷达作为雷达未来发展的方向之一,其最大的特点是构成了从雷达接收端到发射端的闭环信号处理系统,该系统通过实时感知环境和目标信息,基于先验信息和推理调整雷达发射和接收参数,使雷达能在各种环境中处于最优的状态。MIMO雷达由于在发射端具有极高的设计自由度,可以作为实现认知发射的载体,能在阵列结构固定和发射资源有限的前提下,根据不同的任务场景灵活设计发射端各天线的发射信号。在此背景下,本文主要研究基于
弹道导弹和高速飞行器的快速发展,使得高速目标的检测成为雷达的重要任务之一。由于宽带雷达的距离分辨率更高,可以获取的目标特征信息更多,在运动参数估计和目标识别等方面有着更多的优势。因此,研究基于宽带雷达的高速运动目标检测具有重要的应用价值以及明朗的应用前景。为了提高雷达对高速目标的探测和分辨能力,通常要求雷达的发射信号具有大的时宽带宽积,从而导致需要处理的回波数据量增多和现有检测算法的计算复杂度增大
IGBT是电力电子设备和电力系统主电路中常用的功率开关器件,将多个功率半导体芯片按照一定拓扑进行串并联之后封装为一体形成功率半导体模块,当模块中主要的功率芯片为IGBT管芯时,该模块被称为IGBT模块。当IGBT模块电流等级较大时,往往需要多个管芯并联,多管芯并联的IGBT模块的性能主要体现在两个方面,电性能和热性能。其中电性能主要表现在模块内部各并联管芯之间电流分布是否均匀,同时,模块关断时在I
在无线通信技术的快速发展中,网络业务量急速增长。尤其是第五代移动通信系统(5th Generation Mobile Communication System,5G)商用以来,单一的无线接入技术(Radio Access Technology,RAT)难以应对用户日益复杂多变的业务需求,形成了包括5G和第四代移动通信系统(4th Generation Mobile Communication Sy