基于深度学习的时序行为检测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:asdfghjke
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中包含的信息丰富复杂,对视频分析技术的探索和研究得到了各界的高度关注。由于深度学习技术的迅猛发展,深度网络在视频分析中的性能相较于传统机器学习模型有显著的提升,而在视频分析中得到广泛应用。时序行为检测是视频分析工作中基础且具有难度的一项任务,对基于深度学习的检测任务和视频理解工作的发展都具有很大的推动意义。论文针对时序行为检测任务,以典型的端到端时序行为检测模型为基础,在时序多尺度结构、光流特征提取、RGB与光流特征融合三方面开展了研究。R-C3D是典型的用于时序行为检测的端到端网络模型。论文以该模型为基础,对时序行为检测中存在的一些问题进行了研究。视频中往往存在持续时长差异较大的行为,使得基于单一时间尺度的检测算法性能受限的不足,论文设计了两种时序多尺度检测模块,一种采取多尺度特征图融合的方法,一种使用不同支路对不同时长的行为分别进行处理再融合。将两种多尺度检测模块应用到R-C3D网络中,在THUMOS14和Activity Net1.3两个时序行为检测常用数据集上的实验表明,两种网络模块均能提升R-C3D模型的检测能力。视频分类和视频检测任务中常常使用所谓的双流网络,即分别以RGB图像和光流图像作为两个网络输入,然后对二者的处理结果进行融合,得到最终的预测结果。但现有方法没有对双流网络为什么能提升性能进行深入的分析,而且现有的光流计算方法存在计算量大,算法实用性受限的不足。论文对以RGB和光流为输入的时序行为检测网络分别进行了可视化分析对比,说明了光流图像的引入能提供给网络不同于RGB图像的信息,因此将其与RGB图像相结合,可以提升检测网络的检测性能。进一步地,本文提出一种以RGB图像为输入,以光流图像以及光流特征图作为中间监督提取光流特征的时序行为检测模型,可以利用编码器-解码器结构从RGB图像中直接提取光流特征,达到了减少了光流计算的成本且不降低检测性能的效果。传统的双流网络中,采取对RGB和光流两个分支的输出得分进行融合的方式来提升网络的性能,但并未研究在对两个分支的特征图进行融合是否有效。本文对RGB特征和光流特征的融合方式进行了研究,在检测网络的不同阶段对视频的RGB特征和光流特征进行融合实验,并提出了三种融合方法:特征图相加、特征图相乘、特征图连接,发现对双流网络的特征图进行融合能取得比传统双流网络更好的检测结果,且在检测网络特征提取阶段的末端通过特征图连接的方式能取得最好的检测效果提升。
其他文献
与传统机器人相比,双足机器人能够适应更恶劣的非结构化环境,一直都是机器人领域的研究热点。双足机器人的控制系统作为机器人的“大脑”,是其重要组成部分。针对双足机器人行走过程中对数据获取的实时性和稳定性要求,本文设计了一种分布式控制系统,并设计了检测步行状态的步态检测算法。本文的主要工作如下:首先,确定双足机器人控制系统的总体架构,设计了一种分布式、采用三层架构的控制系统,即:底层驱动层、数据处理层、
整体叶盘作为航空发动机的核心零部件,其加工精度和表面质量直接影响着航空发动机的气动性能、作业效率和使役寿命。目前整体叶盘的精加工大多采用人工磨抛的方式,人工磨抛存在加工效率和精度低、表面一致性差、加工要求难以得到保证、粉尘污染危害工人健康等问题。随着机器人加工技术的日益成熟,为整体叶盘的精加工提供了新的思路。但是,传统的机器人夹持单自由度末端执行器的方案存在响应速度慢的问题,导致加工效率难以保证。
在智能仓库与智慧物流领域,移动机器人的应用越来越广泛,大大提升了物品管理效率。室内环境下,定位技术是移动机器人进行运动作业的核心基础。目前,室内定位技术已有很多发展,提出了各种解决方案。其中,射频识别(Radio Frequency Identification,RFID)技术凭借其ID识别、非视距、成本低等突出优势,逐渐受到研究人员的重视,具有较大的研究潜力和应用价值。本文将移动机器人与RFID
大型复杂构件的加工,相比于传统大型数控机床,使用工业机器人铣削系统具有生产柔性好、成本低等优点。但工业机器人的串联结构导致其刚度远低于传统机床,加工过程中易发生颤振现象,而且机器人末端频响函数位姿依赖明显,不同工作区域的颤振稳定性极限变化很大。本文对不同姿态下机器人末端频响函数预测方法和机器人不同姿态和加工工况下的铣削稳定性预测进行研究,可以为机器人铣削加工的应用提供理论指导和技术支撑。主要内容如
湿度测量在人体健康、气象学、农业、林木业、制造业、医学等方面有着广泛应用。随着科技发展,传统湿度传感器已不能满足实际需求,高性能、低成本、可批量化生产的新型湿度传感器研究是现阶段重点。本学位论文围绕氢氧化铜纳米线/氧化石墨烯(Cu(OH)2/GO)复合修饰的石英晶体微天平(QCM)湿度传感器开展研究,主要内容包括:1、采用饱和盐溶液法制备了相对湿度范围为0%到80%的湿度发生装置,将QCM湿度传感
长行程机器人移动平台作为智能磨抛系统的重要组成部分,直接影响着系统的使用性能。本文设计了一套全新长行程机器人移动平台,对国内首套机器人打磨系统中的机器人移动平台进行优化升级,实现磨抛系统使用性能提升。本文设计的长行程机器人移动平台采用了位置模式、速度模式、回零模式等多种控制模式,实现了机器人与移动平台的高度集成控制,实现其最大运行速度不低于2m/s,最大负载达到5T。其次,本文还应用了响应面法对机
在时间序列数据领域,深度学习技术已被用于完成分类任务,相比于传统的机器学习方法其分类效果有较大的提升。但当训练数据规模较小时,模型容易过拟合导致性能严重下降,因此就需要通过数据增强的方式扩大数据的规模,来减小过拟合发生的可能性。现有的数据增强技术能够扩充时间序列数据,但并不能保证扩充后的数据同原样本保持一致分布,而生成对抗网络能够基于原始数据分布生成新的相同分布的数据。现有的生成对抗网络不是针对时
装车卸车移动机器人替代人工装卸货物,实现该作业的自动化,改变主要由人工完成该作业的状况,具有广阔的应用前景。运动控制是装车卸车移动机器人的核心功能之一,本文主要研究其轨迹跟踪算法,并设计其自主导航系统。主要工作和结论如下:根据机器人系统的需求和现有硬件技术条件,设计了基于Ether CAT总线的硬件控制方案。使用UML建模语言对移动功能模块进行建模,基于ros-navigation导航框架,搭建基
自人类出现至今,灵活的手腕和灵巧的双手在人类的生产和生活中发挥着极其重要的作用。人手极强的灵巧操作能力是手腕和双手相互配合的结果,其中任一环节受损都会使人手的功能受到极大的限制。目前,全球范围内,数以百万计的手部截肢患者正在忍受着丧失正常生活能力的痛苦。因此,如何设计出一种能够供截肢患者日常使用的仿人机器人灵巧手是当前国内外学者研究的热点。然而,现有的灵巧手仍然存在着如下三个方面的问题:(1)假手
铣削加工是常用的加工方式,当切削参数选择不当时容易发生颤振,严重影响工件的表面质量和加工效率。若能对铣削状态进行检测,以便及时采取措施抑制颤振,则可以避免造成更大的损失。针对这一问题,本文从试验设计、信号分析、特征识别和软件开发几个方面,进行了以下研究:基于铣削动力学模型,通过求解动力学方程,绘制了稳定性叶瓣图,并据此设计了不同加工参数的铣削试验。采集振动加速度信号,建立了不同铣削状态的数据样本集