面向动作识别的目标分类方法的研究与实现

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:sumjoy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着计算机视觉技术和图像采集技术的发展,以及CPU/GPU等相关硬件性能的不断提高,越来越多的计算机视觉技术被应用于工业生产和实际生活中。而随着人们生活水平的不断提高,越来越多的人对体育运动产生了浓厚的兴趣,投入了大量的时间、财力到运动中,并希望借助于一些运动分析设备对自己的运动提供帮助。因此,基于计算机视觉技术的运动分析应用得到了许多人的青睐。然而,目前市场上存在的一些基于视觉的运动分析软件,都只有一些简单的自动功能,并不能完全自动地对用户的动作行为进行分析、处理。为此,本文提出了一种新的面向视频流中动作识别的目标分类方法,可以实时地对视频流中人体动作进行分类识别,自动地识别到是否有特定行为动作发生。通过大量实验证明,本文提出的方法可以实时地、准确地识别出视频流中特定动作的发生。本文的具体研究内容有:(1) 将最新的人体检测方法应用于本文所研究的人体检测与动作分类问题中,并通过对原始方法的改进,有效地提高了分类准确率,特别是在自然场景下,在我们自己的数据集上对特定视角的人体检测的准确率达到97%。而且可以较精确的定位人体位置,检测结果与人体实际位置的重合率超过95%。(2) 基于对人体检测和动作分类的研究,本文提出了一种新的面向视频流中运动行为识别的目标动作分类方法。通过对连续视频流中的关键动作进行分类得到观测序列,然后对观测序列进行实时分类,识别出特定动作的发生。从而达到从一个连续的视频流中实时识别出特定行为动作的目的。为了验证本文所提出的方法在实际应用中的有效性,我们还实现了一个实时运动视频识别系统,运用本文所研究的方法,可在iPhone 5s上达到30fps的识别效率,对我们建立的数据集中的几种不同的运动视频,均可达到90%以上的准确率。
其他文献
在计算机图形学、计算机视觉等研究领域中,对各种三维场景的建模一直是国内外学者关注的热点,也是极具价值的研究课题。随着计算机仿真和虚拟现实等科学技术的持续快速发展,室内
受激布里渊散射(Stimulated Brillouin Scattering)所需泵浦光功率远小于受激拉曼散射(SRS),是光纤中效率最高的非线性现象。SBS过程可以经典地描述为泵浦波,斯托克斯波与声波
Turbo码是一种性能优异的信道编码,在AWGN信道中可以取得接近Shannon极限的译码性能,适用于对功率要求较高的场合,因此被众多的通信标准采纳为信道编码方案,如3G系统和LTE系
语音转换技术是语音信号处理领域近年来新兴的研究分支,自从被提出以来就体现出强大的生命力,具有广泛的应用前景(例如多语种翻译、多媒体娱乐等等)。语音转换的总体目标是:在保持
红外小目标检测是精确制导武器的关键技术之一。如何快速、准确地实现复杂背景下红外小目标的检测具有重要的理论意义和实际应用价值。本文在介绍当前国内外小目标检测技术发
通信系统中存在着多种类型的干扰噪声,给系统带来不利的影响。在设计通信系统时,往往需要分析系统在干扰噪声下的性能表现。高斯噪声作为通信系统中最常见的噪声信号之一,常
通信网络在过去的几十年中深刻的改变了人们的生活方式,从文本文件传输到多媒体文件传输,从C/S服务模式到P2P共享模式,从90年代末web1.0网站的蓬勃发展到当今web2.0的花团锦
电视的出现与发展极大的丰富了人们的生活,对人类文化的传播和发展发挥了极其重要的作用。随着人类生活方式的转变,人们花费在旅途当中的时间越来越多,因此迫切需要一种能够
随着无线通信技术的发展,频谱资源的使用日趋频繁,无线频谱的紧缺成为限制无线通信发展的新瓶颈。认知无线电技术能够感知频谱环境,实时地调整传输参数,以伺机的方式使用空闲
基于P2P技术的流媒体应用目前已经成为互联网中最主要的应用之一,各种P2P视频直播(live streaming)、点播(VoD)系统的大规模应用引起了研究人员的广泛关注。以PPLive为例,目