基于深度学习的视频人体动作识别研究

来源 :辽宁大学 | 被引量 : 0次 | 上传用户:regelus
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体动作识别是判断一段视频中人的动作的类别。人体动作识别具有广泛的应用前景,如火车站监控、智能医疗机器人、考场作弊行为分析等。传统的动作识别方法需要手动提取视频的特征进行分类,工作量较大且识别率低。基于深度学习的方法能够自动的提取视频中的特征,更准确的识别视频中的动作。目前基于深度学习的动作识别方法主要存在两个问题:一是现有的方法无法有效利用视频中的关键时空信息,特征中存在着大量的冗余时空信息。二是现有方法缺乏对交互动作中关键时空信息的推理,动作识别率尚存提升空间。因此,本文以双流网络为基础提出两种动作识别方法来提高动作识别性能。首先,本文提出一种基于双流时空注意力机制的动作识别方法。该方法先将通道注意力机制引入到双流基础网络中,通过对特征通道间的依赖关系进行建模来校准通道信息,提高特征的表达能力。其次,提出一种基于CNN(Convolutional Neural Networks,CNN)的时间注意力模型,使用较少的参数学习每帧的注意力得分,重点关注运动幅度明显的帧。同时,提出一种多空间注意力模型,从不同角度计算每帧中各个位置的注意力得分,提取多个运动显著区域。接着,对时空特征进行融合进一步增强视频的特征表示。最后,将融合后的特征输入到分类网络,按不同权重融合两流输出得到动作识别结果。其次,考虑到动作识别视频中有许多交互动作,执行交互对象之间和不同帧间的关系推理能进一步的提高识别性能。本文提出一种基于图卷积(Graph Convolutional Network,GCN)的双流异构时空关系网络的动作识别方法。该方法在外观流和运动流分别采用不同的网络结构来提取特征以获取更丰富的视频信息。为了得到与动作相关的多个对象的信息,提出通道分组注意力网络,根据通道信息对每帧的区域进行聚类分组。接着将每帧的不同对象看作图中节点,定义邻接关系后通过GCN建模不同对象的关系,再利用GCN对视频不同帧的关系进行推理来建模视频的时序关系,从而提高动作识别精度。最后,本文的两种方法均在数据集HMDB51和UCF101进行了相关对比实验。实验结果表明本文提出的基于双流时空注意力机制的动作识别方法能充分利用视频中关键时空信息,更有效的识别视频中的动作。本文提出的基于GCN的双流异构时空关系网络的动作识别方法能显著的建模视频中和动作相关的对象信息,挖掘出不同帧之间的关系,有效的识别数据集中的交互动作,提高动作识别的准确率。
其他文献
动漫专业是我国五年制高职院校开设的新专业,目前的专业教学还不够规范,课程设置方面存在很多不足之处。通过实现美术基础共享,加强动漫基础知识和制作技能的学习,加大顶岗实习力
随着科学技术的快速发展以及通讯技术的突飞猛进,新时代下信息化社会的建设发展对数据传输的要求和应用越来越高,光通信作为适应这种通信需求的前沿技术,得到了越来越高的重视度
摘要:当前小学体育教学中存在着师生关系紧张这一问题,原因就在于传统的体育教学方式中普遍存在着教师主观教学,不为学生提供课上自主学习的机会,使得学生的自主性被剥夺、创造性被压制,久而久之,学生们与教师之间不配合、默契下降,进而形成抵触心理。新课标改革中提到,需要从根本上缓解师生关系紧张这一现状才能够更好的推动体育教学的进程。  关键词:小学体育;互动教学;策略探究  小学体育互动教学是以身体活动、健
【正】"倾听"作为一般性的概念曾遭遇过诸多的误解和误读。如果把它作为一门学科进行研究和分析,它立刻会变成鲜活的形象和触手可及的对象,因为它就在你我他的身边和生活之中
为满足图像处理领域多帧累计成像对高帧频、高分辨率数据的实时的采集与缓存的要求,外接大容量DDR3,并充分利用其带宽是亟待解决的问题。结合Xilinx提供的MIG_v4.0IP核,引入
摘要:小学体育课程是一门对学生来说上课非常活跃并且快乐的课程,那么老师在进行体育课程教学当中,首先就要让学生们对体育课堂感兴趣,并且在体育课堂内容的安排当中,也要让学生学到体育知识。根据新课改要求之下,体育老师应该改变教学策略,跟进新改教学内容,创新教学方法,采取多种方式的教学理念,让学生的体育教学变得更加快乐。  关键词:小学体育;快乐教学;教学开展;探究措施  现在要求学生德智体美全面发展,除
镇江竹枝词题材广泛,内容丰富,独具地方特色,反映了镇江的历史沿革、社会习俗、风俗民情等方面的发展与变迁,因此具有较高的文学价值和史料价值。从题材内容角度看,镇江竹枝
以《镇江高专学报》2009--2011年刊载的文章为统计对象,采用文献计量学方法,对其3年中的载文量,栏目设置,项目资助论文,第一作者职称、学历、年龄结构、性别及工作单位,引文量、引
产业发展政策和地区发展政策的制定基于资源的禀赋和分布特征。东、中、西部地区在资源、技术、资金上各有所长,维持现有格局的直接代价是原料、能源和制成品往返运输的费用;
文章详细叙述GPS RTK水下地形测量原理和水下数据的粗差及粗差剔除方凄,以及程序的设计与实现。