【摘 要】
:
群体行为识别是计算机视觉领域一项具有挑战性的任务。不同于个体行为,群体行为过程具有复杂的多人关系,发现群体中关键的交互行为具有重要的研究价值。群体中个体的行为具有多样性,特征信息复杂。群体的交互行为具有时间动态性,交互信息难以获取。本文在总结现有群体行为识别方法的基础上,考虑到个体行为的多样性和群体行为的时间动态性,主要解决了群体行为识别任务中以下几个问题:第一,在个体特征信息复杂的情况下,如何实
论文部分内容阅读
群体行为识别是计算机视觉领域一项具有挑战性的任务。不同于个体行为,群体行为过程具有复杂的多人关系,发现群体中关键的交互行为具有重要的研究价值。群体中个体的行为具有多样性,特征信息复杂。群体的交互行为具有时间动态性,交互信息难以获取。本文在总结现有群体行为识别方法的基础上,考虑到个体行为的多样性和群体行为的时间动态性,主要解决了群体行为识别任务中以下几个问题:第一,在个体特征信息复杂的情况下,如何实现个体行为特征时间编码;第二,在群体交互信息难以获取情况下,如何捕获群体交互过程中双方个体动态依赖的特征。针对这些问题,本文做出了以下工作:(1)针对群体建模的过程中个体特征信息复杂的问题,本文设计了一种融合时间上下文图网络用于群体行为识别。该网络可以分析个体行为特征的时间上下文依赖关系,通过对个体特征采取通道位移的策略,可以捕获个体的时间上下文特征。在图网络推理阶段,使用图网络表示群体行为的关键信息,并采取多图的策略对群体行为进行建模。在建模的过程中引入个体时间上下文特征,可以提高模型的准确性。(2)针对群体建模过程中难以捕获群体交互信息的问题,本文设计了一种Granger因果关系时空图网络用于群体行为识别。该网络使用Granger因果检测分析多人行为的因果交互信息,描述双方个体动态依赖的特征,利用个体间的因果关系强弱关系来捕获群体中的因果关系对。网络根据交互依赖关系,将交互双方的特征融合,并且在融合的过程中考虑了通道比例和时序位移。网络还设计了多尺度距离约束策略约束个体的交互范围。在图网络推理阶段,通过图网络表示群体行为的交互关键信息。与传统方法相比,该网络在外观位置信息的基础上引入了因果交互信息,可以更好的表达群体行为的交互特征。本文的个体和群体行为识别工作均在统一的框架上实现,并在公开数据集上验证了网络的有效性。
其他文献
随着无线设备的广泛部署,使用Wi Fi信号进行人体动作识别,在人机交互等领域起到重要作用。现有的方法针对不同场景下对同一套动作的识别准确率存在差异的问题,提出利用大量的动作数据对模型进行训练。但是,人工收集大量数据耗时耗力,并且模型对大量数据训练时会导致训练周期变长。本文利用迁移学习和少样本学习方法解决上述问题,论文主要工作如下:信道状态信息受环境影响会产生不同的变化,这会导致在不同时间或不同人做
随着具备多种编辑功能的音频软件的广泛流行,非专业人员为了私人目的也可以随意便捷的对音频文件进行各种编辑甚至是恶意篡改,这给检测音频的真实性带来了巨大的挑战。其中,同源复制粘贴篡改和异源拼接篡改是改变音频原始含义最重要的两种篡改方式。同源复制粘贴篡改操作是将原始音频中的某部分信息复制并粘贴到该音频的其他部分,因此原始片段与篡改片段之间高度的相似性致使检测十分困难。异源拼接篡改操作是将两段不同设备录制
近年来,随着新能源汽车大规模接入电网,对电网调节能力以及能源储备的要求不断提高。全球能源短缺问题的日益凸显以及人类环保意识的日益提高,促使绿色能源开发强度不断增大。自中国在第七十五届联合国大会上提出碳达峰、碳中和的“双碳”目标以来,世界各国有关于能源转型路径的关键判断趋于一致。为了能够早日实现“双碳”目标、提高能源储备量,增强能源系统的储备与调节能力显得尤为重要。本文以车网协同技术为基础,结合主流
边缘智能作为边缘计算与人工智能的结合,旨在将人工智能应用推向靠近终端的网络边缘。以深度神经网络模型(DNN)为核心的人工智能应用在边缘智能场景中存在计算时延高的问题,所以在此场景下对DNN计算进行加速是目前的研究热点。模型分割作为一种新兴技术,能有效地减少DNN的推理时长,但目前的研究仍然具有不足之处。本文研究了在“端-边”二层架构和“端-边-云”三层架构下的模型分割调度策略,针对具有截止期限的D
近年来,由于公共安全的迫切需求,安防行业蓬勃发展,但是多数安防管理仍然以低效率的人防为主,智能的监控系统亟需被构建,而行人再识别技术是其不可或缺的关键技术之一,已成为计算机视觉领域的研究热点。行人再识别是非重叠视域中特定行人的检索问题,即判断在某个摄像机中出现的特定行人是否出现在其他摄像机中。目前,监控摄像机一般采用可见光-红外双模式交替以实现全时段的日夜运行,由于实际应用需要,可见光-红外行人再
随着北斗卫星导航系统的全面建成,相关产品和服务的应用范围也越来越广,人们对于卫星导航定位的精度要求也越来越严格,为了获得高精度的导航定位结果,必须准确的探测到卫星信号的周跳。现有的周跳探测方法有很多,但是存在不适用于单频数据,难以探测小周跳,周跳探测精度不高,没有考虑载波相位数据时序特征的问题。根据载波相位数据的时序特征和长短期记忆网络的特点,本文提出了一种基于深度学习的卫星信号周跳探测方法,并通
在现代战争中,雷达工作的电磁环境日益复杂。主瓣干扰信号从雷达接收机的主波束进入,对雷达系统进行屏蔽或欺骗,严重降低了雷达系统对主瓣目标的检测性能。如何对抗雷达主瓣干扰,提高雷达系统在主瓣干扰环境下的探测能力,成为电子对抗领域的核心研究方向之一。近年来,盲信号分离技术被用于直接处理接收信号而无需先验知识,且易于工程实现,具有对抗主瓣干扰的巨大潜力和优势。因此,本文聚焦盲信号分离技术,围绕盲源分离(B
紧凑环(CT)是一种具有自组织结构、高密度和高速度的等离子体团。CT是在紧凑环注入装置上形成并加速,是动能、热能和电磁能的载体。由于其具有这些特性,常常被用在聚变装置的加料上。作为一种新型加料方式,它具有非常大的潜力实现聚变装置的芯部加料。CT还可以用于磁重联、磁靶向聚变和空间等离子体推进等研究领域上,具有非常广泛的应用前景。本论文主要研究内容有EAST-CTI紧凑环注入系统的搭建和测试,放电参数
随着现代社会科学技术的飞速进步,为了满足人们日益增长的信息需求,研究一种新型大容量通信技术已成为当前通信领域的研究热点之一。涡旋光束由于其本身携带轨道角动量(Orbital Angular Momentum,OAM),且携带不同OAM的涡旋光束之间相互正交,因此可作为扩充信道传输容量的信息载体应用到光通信领域。目前,基于OAM的新型光通信技术已成为自由空间光通信领域的热门研究方向之一。对于一套高效
合成孔径雷达(Synthetic Aperture Radar,SAR)由于其出色的性能和广泛的应用,自诞生以来得到了广泛的关注。SAR在深度上和广度上不断地发展,分辨率和成像范围不断地提高,出现了多种工作模式以及新颖的成像算法。广域检测是SAR技术发展追求的目标之一,传统的广域目标检测系统中大多采用多普勒波束锐化(Doppler Beam Sharpening,DBS)成像方法,DBS虽然能够大