【摘 要】
:
目标跟踪是计算机视觉领域的一个研究热点,在智能监控、无人驾驶、人机交互和国防军事等领域都有着非常重要的研究价值,它的主要任务是为了获取视频或者图像序列中感兴趣目标的位置以及运动轨迹,为进一步的语义层分析提供基础信息。根据场景中运动目标数目的不同,目标跟踪可以分为单目标跟踪和多目标跟踪,多目标跟踪相对于单目标跟踪的复杂程度更高,涉及了数据关联。单目标跟踪可以简单理解为只需要完成对视频中单个目标连续数
论文部分内容阅读
目标跟踪是计算机视觉领域的一个研究热点,在智能监控、无人驾驶、人机交互和国防军事等领域都有着非常重要的研究价值,它的主要任务是为了获取视频或者图像序列中感兴趣目标的位置以及运动轨迹,为进一步的语义层分析提供基础信息。根据场景中运动目标数目的不同,目标跟踪可以分为单目标跟踪和多目标跟踪,多目标跟踪相对于单目标跟踪的复杂程度更高,涉及了数据关联。单目标跟踪可以简单理解为只需要完成对视频中单个目标连续数据的滤波,它侧重于设计复杂的外观模型或者运动模型来区分目标和背景。随着深度学习的快速发展,基于深度学习的目标跟踪逐渐成为国内外学者的研究主流,并且取得了一定的研究成果。但是由于目标运动和测量值的不确定性,目标跟踪是一个比较困难的状态估计问题。本文采用粒子滤波思想,在深度学习框架下研究基于检测的目标跟踪算法,分别将其应用在单目标和多目标领域。本文的主要研究内容和创新点如下:(1)构建基于粒子滤波的长短期记忆网络(LSTM)模型。针对传统的LSTM难以处理高维随机序贯数据的问题,本文提出了一种新的长短期记忆网络(PF-LSTM),该网络借鉴粒子滤波的思想,利用一组加权粒子近似潜在变量,并根据贝叶斯规则通过LSTM的门控机制更新潜在状态分布。(2)研究PF-LSTM在单目标跟踪领域的应用。针对现有的目标跟踪算法不能很好的处理目标运动不确定性的问题,基于PF-LSTM模型,本文提出了深度粒子滤波跟踪器(DPFT),可以有效对视频序列中的不确定性进行建模。(3)研究PF-LSTM在多目标跟踪领域的应用。针对多目标跟踪中的数据关联问题,基于DPFT模型,本文设计了一种数据关联组合问题的模型,该模型包含了目标存在概率估计的模型以及基于LSTM的数据关联算法,目标的出现和消失可以完全从数据中学习,实现了在线多目标的端到端学习。(4)评估所提算法的有效性。DPFT算法在两个基准数据集OTB100和VOT2016上的实验结果表明,目标跟踪的精确率达到82.1%,成功率达到62.3%。多目标跟踪算法在MOT16数据集上的实验结果表明:该算法的MOTA达到48.2%,MOTP达到75.2%,性能优于其它最先进的跟踪算法。
其他文献
目前,裁判文书的书写愈加规范,且随着电子化裁判文书的普及,裁判文书已然成为司法领域研究的重要对象。本文基于孪生神经网络,并结合文本表示、词嵌入、预训练语言模型、文本特征提取等技术对裁判文书的相似性进行研究,为司法判案提供参考,以实现司法领域“同案同判”的需求。主要的工作如下:(1)针对裁判文书的领域性、措辞严谨性以及动态变化性提出了基于TinyBERT-CNN的裁判文书文本表示模型。其中基于Tin
茶叶是我国最主要的饮品之一,并且中国也是茶叶种植规模最大的国家之一,而茶叶的各种病害一直严重影响着茶叶的产量和质量。藻斑病作为主要病害之一,其覆盖辽阔,在全国主要茶区均有发生。藻斑病会对茶树正常代谢造成胁迫,导致茶叶产量和品质下降,给茶农造成直接经济损失。当前,藻斑病的传统检测方法时限长、预处理复杂且成本较高,难以在实际生产中大面积推广应用。因此,准确识别茶叶病害及时采取防治措施成为茶产业发展的关
随着“数字化”不断地普及,现实生产、生活中大量的如文本、网页、图像等信息需要被存储。许多互联网、高科技公司都配备专门的服务器来存储这些有价值的数据。大规模、高维度的数据中通常包含噪声和特征冗余,直接存储这样的数据将会带来高昂的存储代价,并且是不可取和没必要的。机器学习算法则被用于分析、挖掘数据当中有价值的信息。大多数在小规模数据集上使用的机器学习算法已经不能很好地处理这样大规模的数据,因为它们在处
地震作为破坏性极强的自然灾难之一,给人类带来的教训是惨痛的,而有效的地震预报可以减少人员伤亡和经济损失。导致地震的因素繁多但其因素之间存在非线性关系,随着计算机技术飞速发展,使得机器学习模型解决复杂的、非线性的问题广泛进入应用。本文使用MATLAB和python平台,在地震震级预报这一领域内使用自组织特征映射神经网络(SOM)和支持向量回归算法(SVR)提高预报精度。本文首先介绍了机器学习模型在地
社交物联网是融合了物联网和社交网络的新兴范式,它使社交功能从最初的人与人之间扩展到人与物以及物与物之间。如何实现这人与物以及物与物之间的社会交互,是一个亟待解决的问题。自然语言生成技术,关注于从非语言数据中生成自然语言的文本,这对于在社交物联网中实现人类和其他智能对象之间的无障碍交互至关重要。然而,现有的数据生成文本研究方法依赖于特定的模板和标准神经网络模型,当应用于具有不同含义的大规模结构化数据
发光二极管(Light-Emitting-Diode,LED)作为新一代的电光源因其使用寿命长、效率高、体积小、绿色环保等优点被广泛应用于各种照明场合。LED需要有恒定的直流电流支持才能发出稳定的照明灯光。因此,LED驱动器是整个LED照明设备中最为关键的部分,它决定了照明的质量并严重影响整个照明设备的销售价格、使用开支以及使用寿命。单级式LED驱动器因其成本和效率上的优势,深受市场的欢迎。传统单
在未知环境中,移动机器人的即时定位与地图构建(Simultaneous Localization And Mapping,SLAM)是机器人导航领域最重要的研究课题之一。随着近些年深度学习技术的不断发展以及在图像处理方面的优异表现,基于深度学习技术的视觉SLAM也渐渐被关注。而定位技术作为SLAM中最主要的组成部分,对定位技术的研究也成为机器人技术研究的重要方向之一。本文在对现阶段机器人定位技术和
复合材料因具有比强度高、比模量大等优异材料性能在土木工程,航空航天等众多领域得到广泛的应用。在复合材料在服役过程中,不可避免会因面临高压,高温,腐蚀等不利服役环境的影响,形成材料损伤,特别是复合材料内部界面分层以及微小广泛的基体裂纹等不容易被肉眼所观察到的损伤。这类损伤将随着时间不断发展,成为复合材料结构的重大安全隐患,一旦发生工程事故,将给社会带来巨大经济损伤与人员伤亡。故对复合材料损伤监测成为