基于卷积神经网络与视频复合特征的人体动作识别

来源 :北京印刷学院 | 被引量 : 3次 | 上传用户:wwwwcccc3012
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视频中的人体动作识别研究主要是为了能让计算机更好的理解人体动作的意义。使计算机视觉更好的应用于人机交互、监控安全、人工智能等领域。人体动作识别的主要难点集中于视频中的动作特征提取与动作特征的识别分类器研究两方面。由于视频图像是由三维空间中的物体投影于二维图像之中而形成的,所以在三维物体在被图像采集的过程中不同的光照、背景的变化、环境的遮挡都会造成二维视频图像中的明显变化,增加了动作识别的难度。如何在视频图像中提取到人体的运动信息成为了视频动作特征提取的关键点。提取具有更强的人体运动信息描述能力与可识别能力的视频特征是人体动作识别的重要研究方向。视频特征的分类器如何更好的学习视频特征,提取更抽象的运动信息同样充满挑战。本文的主要研究工作分为了两方面:1.本文提出了一种结合视频中的时空兴趣点特征、光流特征和人体灰度图像的复合视频特征。时空兴趣点特征作为视频分析中的一种常用特征具有全局性的运动信息描述能力,而光流特征则具有较强的局部运动信息描述能力,视频中的人体灰度图像则可以反映人体的瞬间运动姿态。本文将这三种视频特征相结合得到了一种对人体运动信息描述能力更强,在视频分类器中的可识别能力更高的视频复合特征2.本文应用三维卷积神经网络技术作为人体动作识别中的特征分类器。相比于传统的线性支持向量机分类器、模版匹配分类器等浅层学习分类器,深度卷积神经网络分类器可以更好的提取出人体运动中的抽象信息,对视频特征的学习能力更强。并且由于三维卷积神经在卷积过程中共享的权值核不仅可以在图像的水平与垂直方向滑动,同时可以在时间轴上滑动,所以三维卷积神经网络可以更好的定位运动目标在视频图像中的空间位置与动作发生的时间位置。
其他文献
物流行业随着全球经济的高速发展得到了突飞猛进的发展,并取得了相应的成就。在激烈的市场竞争中,物流行业的发展需要考虑到物流成本的利用效率。本文从灰色关联理论出发,以
少数民族贫困地区由于其独特的自然条件和文化传统,一直是我国扶贫开发的重点和难点。通过梳理民族地区的扶贫政策和简要的文献综述,将《中国农村扶贫纲要》实施的2001—2011
目的了解女大学生的焦虑、抑郁心理症状,探讨人格特征等因素与焦虑、抑郁心理症状的关系,为干预研究提供依据。方法对安徽省1334名女大学生应用Zung焦虑自评量表、Radloff流
随着油气田开发技术的不断提高,碳酸盐岩储层水平井酸压技术不断地得到重视和推广。由于碳酸盐岩储层的渗透率相对较低,同时储层非均质性较大,因此开发难度大,采出程度相对较
本文通过学生作文、调查问卷和个别访谈,研究了英语专业四年级学生在议论文写作中,教师反馈与同级反馈对其写作修改的影响。结果表明:(1)教师反馈与同级反馈数量大致相等,侧
鉴于英语语言的自身特点,一词多义现象在英语中十分普遍。其词义灵活多变,语义选择范围甚广。在具体的英汉翻译过程中,英语的语义选择常常会给译者带来迷惑和困扰。本文以一
第一部分Connexin26相关迟发性非综合症型遗传性耳聋小鼠模型的建立及鉴定目的:建立及鉴定Connexin26相关迟发性非综合症型遗传性耳聋小鼠模型。方法:使用Cx26loxp/loxP小鼠与R
基础教育课程改革提倡主动、能动的建构学习过程,关注学生如何参与学习活动获得自我发展,注重学生在过程中创新思维、实践能力的获得。在理论研究中,教育工作者则更加关心“
中国平面设计教育经历了手工教育与工艺教育、图案教育孕育,从实用美术、商业美术发展而来,新中国成立后历经从装潢美术、平面设计以及视觉传达设计等教育形态演绎,不断探索
教育是永不过时的话题,互联网的发展和电脑的普及催生了在线教育,技术和资本的推动又使得在线教育的模式和产品形态更加多样化,移动互联网的在线教育,已经不再是最初的线下教