时空正则化相关滤波目标跟踪算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:estone
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机视觉中,目标跟踪技术常常用于机器人、智能安防、视觉导航和精准制导等诸多领域。虽然学者在该领域做出了大量的成就,但是设计一个在目标外观发生显著性变化时能够同时保持较好的效率和鲁棒性的跟踪器依旧困难,其原因在于,复杂跟踪器具有较好鲁棒性但效率低下,而简单跟踪器效率较好但是鲁棒性较差。相关滤波器属于简单跟踪器,因此需要提升它的准确性和鲁棒性。本文以相关滤波跟踪框架为基础,聚焦于提升相关滤波器的准确度和鲁棒性,并以工程化的方法优化计算效率,具体在特征提取、边界效应问题和模板漂移问题上进行研究。本文的主要贡献如下:第一,针对特征提取,本文提出了一种跟踪目标表征方法,通过同时提取手工特征和深度特征完成了对跟踪目标的强有力表征。其中手工特征为标准的FHOG特征;深度特征由保持平移不变性的残差网络结构提取,并且针对信息重要性引入了注意力机制来强化目标和背景的区分度,针对尺度引入了图像金字塔机制增强图像对尺度变化的稳健性。本文将整个跟踪机制分为尺度滤波器和位置滤波器两部分,利用高效的手工特征计算尺度滤波器,利用高精度的融合特征计算位置滤波器,完成了精度与速率的权衡。改进特征之后的算法在OTB2015、TC128、UAV123和LaSOT数据集上的成功率分别为83.7%、70.0%、60.9%和31.9%,在成功率得分上高于基准算法-基于学习的背景感知相关滤波器(learning background-aware correlation filters for visual tracking,BACF),分别高出7.8%、8.7%、4.2%和4.2%。第二,针对边界效应问题,本文提出了一种新的基于空间正则化的目标轮廓自适应估计方法,通过添加空间正则项的方式缓解了边界效应问题。本文在传统的矩形掩模的基础上添加了一种空间正则项,在优化算法中,以迭代空间正则项为增项,可以让滤波器自适应地学习到空间惩罚,当被遮挡的时候,对遮挡部分引入较大的权重惩罚,鼓励学习到的相关滤波器将注意力放在更加可靠的未遮挡区域上。基于OTB2015数据集的消融实验表明,在添加了空间正则项之后,算法的成功率提升了2.0%,相较于基准算法BACF成功率提升了9.8%。第三,针对模板漂移问题,本文提出了一种新的基于时间正则化的目标函数优化方法,通过添加时间正则项的方式缓解了模板漂移问题。本文在标准的相关滤波目标函数上添加了一种时间正则项,让历史高置信度样本约束相关滤波器的更新方向,避免了相邻帧之间相关滤波器产生突变,缓解了跟踪目标外观显著性变时的模板漂移问题。此外,本文提出了一种基于峰值旁瓣相关能量系数的更新策略来完成时间正则项的更新,首先根据峰值旁瓣比提出了峰值旁瓣相关能量系数,并以此设计整套的校验机制,通过该校验机制的滤波器将会被记录,并通过加权融合的方式完成对时间正则项的更新。基于OTB2015数据集的消融实验表明,在添加了时间正则项之后,算法的成功率提升了0.9%,相较于基准算法BACF成功率提升了8.7%。本文针对特征提取、边界效应问题和模板漂移问题展开了深入研究,并进行了改进与增强,使得算法在复杂环境和目标外观显著性变化时仍旧能够保持较好的鲁棒性和效率。算法在OTB2015、TC128、UAV123和LaSOT数据集上的成功率分别为86.2%、76.3%、63.6%和33.0%,相较于BACF分别高出10.3%、15.0%、7.9%和5.3%,同时执行效率保持在12.1fps,具有一定实际运用的价值。
其他文献
图像描述是一种让机器理解图像内容并生成对应自然语义描述的技术,它在不同领域都有着非常大的应用价值。本文选择遥感领域作为特定研究领域,将在该领域的图像描述算法称为图像解译,它能够帮助人类更好地从遥感图像中获取所需的地理空间信息。图像解译算法大多基于编码-解码框架,它由用于图像特征提取的编码器和生成解译语句的解码器构成。现有图像解译算法忽略了遥感图像在成像方式、图像内容上与自然图像的差异,直接采用预训
近年来,基于深度学习的目标检测算法发展迅速,被广泛应用在智慧交通、智能安防、智能生产、航空航天等领域。目前目标检测在现实应用有两点不足:第一点是,基于深度学习的目标检测算法大多基于GPU(rocessing Graphics Unit P)和CPU(rocessing Central Unit P)平台实现,但功耗过高限制了其应用场景。第二点是,基于深度学习的目标检测算法网络权重数量大,运算复杂度
随着计算机视觉和机器学习等相关技术的飞速发展,使用城市街景图片获取城市大范围、多维度量化感知的研究日趋活跃,现有相关研究表明,利用街景图片、有限的图片评价数据和机器学习算法实现城市多维感知具有合理性和可行性。本文以数据感知成都各区域美观和活力程度为研究课题,重点研究了融合两类数据的量化评分模型、基于支持向量回归的自动评分模型以及人为感知城市街景的主要决定要素等,主要研究内容分为四部分。数据采集与分
随着科技的进步,大量基因遗传性疾病得以确诊,人类孟德尔遗传网数据库收集的5000余种单基因病中,遗传性神经肌肉疾病占很大比例,包括脊肌萎缩症(Spinal Muscular Atrophy,SMA)、杜氏肌营养不良症(Duchenne Muscular Dystrophy,DMD)等严重的遗传性神经肌肉疾病。根据调查,此类疾病在我国的发病率高,其中,仅杜氏肌营养不良症在新生婴儿中的发病率就达到了1
自闭症不仅会使患者出现社交障碍、行为刻板、兴趣狭隘等症状,还会增加其患其它疾病的风险,如癫痫、发育迟缓等。为了探究自闭症等精神疾病的致病原理,为治疗自闭症提供支撑和靶点,需要对大脑机制进行深入研究。本文基于自闭症患者和正常对照者的脑成像数据,包括结构像和功能像。在预处理之后,通过图论的知识和大数据相关技术对脑网络进行研究分析。基于机器学习理论训练生成自闭症辅助诊断模型。最后结合在脑机制研究中的所得
在大数据和智能化的时代浪潮下,人们对于微小信号的测量有着更进一步的追求,这就推动了新型传感器和高精度检测系统的发展。和传统的传感器相比,具有高灵敏度、良好的稳定性、因不同镀膜而具有的多样性等特点的石英晶体微天平(Quartz Crystal Microbalance,QCM),不仅结合了化学、材料、物理等领域的优势,给传感器领域带来了更多可研究的方向,也给高精度传感和测量带来了一种新的研究途径。本
随着各种社交平台飞速崛起,自然语言处理技术俨然成为了生活中密不可分的一部分,其中以中文关键词为核心的研究是机器翻译、信息检索以及舆情监测等诸多领域的重要技术,一直以来都是自然语言处理研究领域里的热点。然而,当前中文关键词提取算法大多使用现成的分词工具来获取候选词,这导致算法的性能极大地依赖于事先分词的准确性。另外,现绝大多数的中文关键词情感分析算法都建立在关键词标签预先提供的前提下,而实际应用场景
随着互联网时代的到来,人们的娱乐活动日益丰富,获取信息的来源日益广泛,观看视频逐渐成为一种主流的娱乐方式和获取信息的重要途径。但是,由于视频的类型太多,各平台视频的数量也很多,如何在大量的视频中,根据用户喜好快速向用户推荐用户喜欢的视频就显得很重要了。具有个性化推荐功能的云点播平台就能让用户在云端获取和启用云点播服务,并且向用户智能推荐视频。现有云点播平台存在很多不足,并不完善,因此本文研究的内容
实际应用中,铁轨、发动机、齿轮设施和零部件易在服役过程中产生疲劳损伤、内部缺陷等问题,导致在使用过程中发生断裂,造成灾难性事故。因此精准有效的缺陷检测技术已成为工业自动化进程中的重要部分。其中无损检测因其应用广泛性在检测领域备受关注。与传统方法相比,电磁热成像利用电磁感应涡流在缺陷处的畸变累积焦耳热,增加了缺陷和非缺陷区域间的温度对比度,具有快速、非接触、非交互、直观成像等优点,已经成为检测研究热