基于深度学习的人体动作识别

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:zjx1978_0901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,计算机技术及网络技术迅猛发展,计算机视觉被广泛的应用于各个科学领域。而人体动作识别作为计算机视觉的一个重要分支,其本质就是针对运动视频中的人体动作信息进行正确分类,它在智能监控与安防、人机交互、运动分析等领域有着十分重要的意义。目前人体动作识别方法还存在以下问题:首先,如何提取视频中的运动信息并进行表征一直是该研究领域的难点之一;其次,随着Kinect等深度相机的出现,为研究者们提供了人体动作视频的深度信息,而如何有效利用这些深度信息实现人体动作的识别与分类也是一个重要的研究问题;最后,当样本数据量较小时,如何利用深度学习网络模型实现较高的人体动作识别率?本文基于UTD-MHAD数据库,针对Kinect同时捕获的RGB视频与深度视频进行人体动作识别的研究,并就以上问题开展了相关讨论与分析,具体内容如下:(1)针对RGB视频,为了同时获取运动的空间信息与时间信息,文中提出了一种改进的运动历史图的方法:去除视频首尾冗余帧,保留关键帧,然后提取灰度运动历史图像,然后使用彩虹编码将其伪彩色化,增强感知质量,再对数据进行垂直镜像与加噪,增广数据。通过实验验证,改进后的运动历史图像方法的识别准确率提升了 14%,验证了方法的有效性。(2)针对深度视频,首先对每个三维像素点旋转一定的角度,模拟不同的视角,并增加数据量。然后将深度视频的每一帧投影到三个正交平面,获得深度运动图来表征运动信息。接着对其进行彩虹编码,增强数据。实验数据表明,该方法可有效提升深度运动图的识别准确率。(3)为了充分利用由RGB视频与深度视频提取的运动信息,构建了一个四层的并行网络,分别以彩色运动历史图、深度运动图的前视图、侧视图、顶视图作为输入数据,通过实验选择合适的卷积神经网络模型进行微调。(4)为比较特征融合与决策融合这两种信息融合方式的性能,分别进行实验,先比较了不同特征融合方式的结果,然后采用不同的融合法则(权重法则、平均法则、乘法法则等)进行决策融合,获得最终的分类结果。最后还实验了两种验证方式(跨目标验证与同目标验证),表明了样本的类内差异。(5)在Ubuntu环境下MATLAB编程平台上,开发了一款人体动作识别软件,并且通过实验证明了本文方法的有效性。
其他文献
在车牌图像的反转灰度直方图的基础上,定义了全峰和半峰的概念。利用自然段落的思想,根据自然段落的分布和长度,确定出阈值所在全峰的范围。在此范围内求极值,将求阈值的灰度范围大大减小,降低了图像二值化的算法复杂度和运算量。实验证明,该算法效果良好,即使对于偏亮和对比度低的图像,也能达到满意的效果。
福建省武平澄邦大理岩矿床位于成矿有利的闽西南坳陷带明溪—武平坳陷中,十方—岩前复式向斜西翼。矿床赋存在燕山早期第三阶段第三次侵入的黑云母花岗岩与震旦系地层、石炭
目的研究分析双黄连口服液和雷尼替丁治疗口腔溃疡的临床疗效。方法选取2016年9月~2017年9月我院收治的口腔溃疡患者90例,将其随机分为双黄连口服液组、雷尼替丁组以及对照组
<正>宁夏灵武市支行通过"企业收购,整体转让"的方式,配合"还本减息"对策,成功清收了一笔历时十年逾千万元的大额不良贷款。2017年1月份,宁夏回族自治区灵武市支行收回原贷款
自上个世纪80年代中期诠释学被介绍到中国大陆以后,逐渐为许多学者所关注和接受.有关诠释学的著作、论文日渐增多,对诠释学著作的翻译和解读亦有升温之势.今年3月14日,102岁
<正>亲子沟通是实现家庭教育功能的重要方式之一.家庭中的亲子沟通是指家庭中父母-子女之间交换资料、信息、观点、意见、情感和态度,以达到共同的了解、信任与互相合作的过
会议
我国经济从高速增长阶段转向高质量发展阶段,内在要求深化消费税改革,更好地引导各级地方政府关注培育消费增长,更好地在地方税体系中融入"消费"要素,建立以扩大消费为导向的
郭屯矿井井筒穿越多层地层,工程地质条件复杂。为了给矿井设计和施工提供可靠的工程地质参数,利用郭屯矿井井筒检查孔钻探资料,结合土工实验、岩石物理力学性质实验资料和岩
阐述了赤峰市煤炭资源现状,依据赤峰地区成煤规律研究,指出了今后找煤方向。详细划分了寻找白垩系下统煤盆地靶区目标15个,寻找侏罗系煤产地靶区目标16个。 The present sit
对青海高原不同发育时期的麻叶荨麻主要营养物质动态变化进行分析,结果表明,在麻叶荨麻整个生长发育过程中,蛋白质含量和氨基酸总量呈下降趋势,但总体保持较高水平;矿物元素含量呈