【摘 要】
:
近年来,与日俱增的移动相机如无人机搭载相机、可穿戴相机等,能够以灵活的视角对场景中目标进行观测。无人机搭载相机的垂直俯视视角能够以广阔的观察视野对目标进行观测,可穿戴相机的平视视角能够以沉浸式的视角对目标进行观测,二者互补能够对场景中目标进行灵活有效的全方位观测。跨大视角的多相机协同技术,使得基于俯视和平视视角结合的视频监控技术在目标跟踪、行人再识别、行人动作检测和行为分析等领域有着重要的研究意义
论文部分内容阅读
近年来,与日俱增的移动相机如无人机搭载相机、可穿戴相机等,能够以灵活的视角对场景中目标进行观测。无人机搭载相机的垂直俯视视角能够以广阔的观察视野对目标进行观测,可穿戴相机的平视视角能够以沉浸式的视角对目标进行观测,二者互补能够对场景中目标进行灵活有效的全方位观测。跨大视角的多相机协同技术,使得基于俯视和平视视角结合的视频监控技术在目标跟踪、行人再识别、行人动作检测和行为分析等领域有着重要的研究意义。然而,高空俯视视角下在保证广阔视野的同时,丢失了目标大量外观特征信息。相反,地面平视视角近距离、自由移动得观察方式能够获取丰富的外观细节,但是缺乏观察目标的全局运动轨迹。将高空俯视视角和多个地面平视视角相机相结合的第一步是实现观察目标的关联,然而,大视角差异使得两个视角下目标的外观和运动特征有明显差异。如何进行大视角差异下多行人关联是一个极具挑战的问题。为此,本文提出一种使用空间分布特征对目标进行关联的方法。具体来说,在俯视视图下通过目标的位置信息进行建模,并定义匹配代价函数,以确定地面平视相机穿戴者的位置和观察方向。此外,基于空间上对不同视角下多行人的关联结果,进一步在时间域上对同一视角下进行多行人进行关联,提出了基于双耦合的马尔可夫决策过程的联合视角下多行人跟踪方法。具体来说,对任意视角下的每一个目标用一个马尔可夫决策过程描述目标的生命周期,通过两个视角的互补信息,实现对目标的持续有效的跟踪。另外,为了对提出跨视角下多行人关联和多行人跟踪方法的有效性进行评估,本文使用无人机搭载相机和多个头戴式相机采集并标注了一个存在大视角差异的俯视和平视视频序列的数据集,并且实验结果证明了所提出方法的有效性。
其他文献
精神分裂症是一种严重的精神疾病,具有复杂的神经机制,其病发原因至今尚未明确。同时其临床症状涉及到思维、情感和行为等多个方面,且存在明显的个体差异性,使得对于病情的诊断较为困难。由于精神分裂症是一种神经发育异常疾病,研究患者的大脑机制变化,对其病理的揭示以及患者的合理治疗都有重要的意义。静息态功能磁共振成像(fMRI)是一种非侵入式脑影像采集技术,能够记录脑神经在基线状态下的自发活动,被广泛应用在各
电子散斑干涉(Electronic Speckle Pattern Interferometery,ESPI)测量技术作为一种重要的光学无损检测技术,目前已被广泛应用于科学研究及实际工程领域。在电子散斑干涉测量技术中,待测物理量与编码在条纹中的相位信息直接相关。准确地从条纹图中提取相位信息是电子散斑干涉测量技术成功应用的关键。因此本文针对电子散斑干涉条纹图相位准确提取中涉及的一些技术开展了以下研究
在现实环境中,人类的目标语音信号通常会被噪声干扰,这会严重降低语音的可懂度,从而降低语音识别系统的性能。针对噪声干扰,前端语音分离技术是降噪过程中最常用的方法之一。一个好的前端语音分离系统能够极大地提高语音的可懂度和自动语音识别系统的性能。语音分离已在诸多领域展现出很好的前景,但也存在大量的不足与挑战。语音信号的复杂性使得即使是同一类语音信号的声学特征也存在很大的差异,这对语音分离系统的学习能力和
医学图像由于医学成像系统的局限性,不可避免地会出现噪声和模糊等现象,因此,对医学图像进行滤波和增强成为医学分析前重要的预处理步骤。全变分模型和Retinex方法分别在滤波和增强方面有着广泛的应用,本文基于这两种方法,选择了光学相干断层扫描(Optical Coherence tomography,OCT)、超声波及电子计算机断层扫描(Computed Tomography,CT)等多种类型的医学图
随着网络攻击的规模和网络数据量的成倍增长,组织必须开发新的方法来保护其网络和数据不受不断变化的威胁参与者的动态影响。随着在现代企业网络中部署更多的安全工具和传感器,安全事件和警报数据的生成量持续增加,这使得在大海捞针中更难找到针头。组织在监视,预防,检测和响应网络安全事件以及对网络的潜在攻击时,必须依靠新技术来协助和扩充人类分析人员。在这项工作中,重点是将网络流量分类为良性或恶意。首先,前馈完全连
切换系统是混杂系统中的一种典型代表,切换系统由一系列被微分方程和差分方程描述的子系统和一个决定这些子系统切换的切换信号组成。实际物理系统很多具有这种切换特性,这就赋予了切换系统丰富的应用背景,切换系统的研究也备受关注。随着网络技术的发展,控制系统的规模越来越大、控制精度要求越来越高,鉴于传统周期采样控制在信息冗余方面的劣势,一种新的基于事件的控制方式受到广泛关注。动态事件触发作为事件触发控制的一种
面部表情是人类智力的一个非常重要的方面。其中,通过面部表情表达人类情感是最有说服力的证明。近年来,深度学习成为一种趋势,特别是卷积神经网络,由于在人机交互领域的大量应用,在近十年来得到了广泛的研究。在相同条件下或至少相似条件下,研究人员已经能够从在实验室中拍摄的图像中获得良好的结果。然而,在任意的面部图片与各种头部姿势和不同照明条件下,这些模型并不是很好。野生表情是指在真实环境中捕获的,自然的表情
在线教育的蓬勃发展为人们提供了一种新的学习方式,各大在线学习平台的崛起为人们提供了方便的学习途径。在传统模式下,园林植物的教学存在需要改进的地方,同时由于专业和学科的特殊性,园林植物的在线学习本身具有独特性。通过对相关文献的研究,得出目前园林植物学习存在种类繁多、记忆不清、图文描述比较抽象、空间感尺度感不足的问题。本研究探讨通过搭建园林植物学习平台解决这些存在的问题。利用问卷调查的形式,分析了植物
计算机断层成像技术(Computed Tomography,CT)可以在未经手术的情况下获取病人体内密度信息,是临床图像诊断的重要手段之一。病人体内如果有金属植入物,则会在CT图像中产生金属伪影,此金属伪影会严重干扰临床诊断结果,并影响放射治疗计划中剂量计算的准确性。目前来说,去除金属伪影的传统方法主要集中在对投影数据的处理上,而不能应用于重建后的CT图像,不便于医院、普通研究者等无法获取投影数据
金属3D打印技术(也称增材制造),相对于传统的减材制造技术,其制作过程更简单,能够生产出结构更为复杂的工件,越来越受到各个领域的重视。然而,3D打印技术还处于高速发展时期,技术尚未完全成熟,因此打印工件内部存在不同类型的缺陷。孔隙缺陷很大程度上会影响工件性能和工件使用寿命。检测出工件中孔隙缺陷的位置、形态、数目,可以为缺陷形成的技术机理研究提供分析基础。CT技术能够在不破坏工件的情况下,重建出工件