视频图像中的人体目标检测方法研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:eponvlan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人体目标是基于视频的应用中最为重要的一类目标,人体目标检测也是目标检测领域的一个研究难点和热点,其应用领域相当广泛,主要包括智能视频监控、汽车辅助驾驶、自动人数统计、视频压缩以及视频检索等。由于人体目标属于非刚性目标,目标自身以及目标之间在不同的条件下差异较大,所以导致人体目标检测所面临的困难比其他目标检测(如人脸检测)更大,需要考虑的情况也更多。 本文系统地研究了如何在视频图像中检测人体目标的问题,由于大部分应用都是针对直立行人,所以本文主要关注直立行走的人类目标。根据应用的场景和视频采集设备的不同,本文对所研究的问题进行了分类:1)静止摄像机近距离拍摄目标;2)静止摄像机远距离拍摄目标:3)运动摄像机拍摄场景;4)红外视频拍摄场景。 从以上四个子问题出发,本文提出了相对应的解决方法,其主要内容包括: 1)运动分割是很多基于视频的应用的第一个步骤,由于运动分割的效果在很大程度上决定了后面目标检测的精确度,所以本文对实时精确的运动分割方法进行了研究,提出了一种基于两次背景更新的运动分割方法,能够快速精确地实现视频序列中多个运动目标的分割,并消除背景噪声运动、目标阴影以及场景变化的影响。 2)针对静止摄像机近距离拍摄目标的情形,提出一种基于运动分割和肤色判别的人体目标检测方法。该情形下由于场景的背景可以准确估计,且目标的颜色信息较为清晰,所以可以通过运动分割获取精确的运动前景,然后在运动前景区域中采用肤色判别和人体目标的长宽比经验值相结合的方法对目标进行检测。该方法速度快,适用于一些监控场景较小的应用。 3)针对静止摄像机远距离拍摄目标的情形,提出一种基于运动形状周期性特征的人体目标检测方法。该情形下由于目标较小,颜色信息不清晰,所以无法通过肤色等特征对其进行判别。本文在前人研究成果的基础上,提出了改进的解决方法,该方法采用Hausdorff距离计算运动目标在一段时间内的投影相似性,并将结果存储在码书中,对目标的判断和对目标的跟踪都使用码书来完成。相比现有方法,该方法减少了对存储空间和计算时间的要求,适用于一些大场景的监控应用。 4)摄像机运动时,场景背景不断发生变化,显然无法通过运动分割获取前景区域,因此本文采用了另外一种研究思路,即统计模式识别的方法。本文首先对人体目标特征的提取方法进行了综述,然后提出了基于二维Gabor小波变换和PCA方法的特征提取方法,由于二维Gabor小波变换响应能够在多个尺度的多个方向上对目标的局部区域像素值变化进行描述,所以相比只能在水平、垂直和对角线三个方向上描述目标的Haar小波,其优势明显。本文利用三个主要的行人库与Haar小波特征提取方法进行了对比实验。 5)本文还提出了采用二维Gabor小波进行人体目标检测的具体方法,即采用Adaboost算法对高维的Gabor特征进行选取,并训练出强分类器。为了提高检测精确度和加快训练速度,提出利用单一正样本库与多个负样本库训练出的多个强分类器级联组成的层级检测分类器对目标进行检测。 6)针对很多分类器训练方法利用大样本进行训练时资源消耗过大的问题,本文提出了一种基于Mean Shift聚类的样本减少方法,该方法通过采用Mean Shift算法对同类样本进行聚类,找出同类样本的模态点,并代替原始样本,从而有效减少样本数。与其他样本减少方法相比,该方法能够在不显著影响分类精度的前提下减少样本的数量,加快训练速度。 7)针对红外视频的特点,本文提出了解决方法。该方法首先利用红外图像的像素值近似呈现单模态分布的特点,对高亮像素进行检测,然后采用灰度直方图和投影直方图柏结合的2D直方图特征对目标进行检测。
其他文献
纹理合成技术是计算机图形学的一个主要研究方向,因为其实用、简便的特性使得它在许多领域有着重要的作用,尤其近几年来,随着CG产业和在线游戏的快速发展,对于高效及高质量的纹理
计算机动画一直是计算机图形学领域的一个研究热点,影视特效的发展以及电子游戏的强力需求进一步推动了这一方向的研究。然而,真实世界蕴涵着复杂的运动规律,而计算机图形学领域
多媒体数据的有效表达是实现其语义理解和分类识别等应用一个基础性难点问题。多媒体数据的张量表达能有效避免传统基于向量或矩阵等形式的表达方法在高维多媒体数据上产生的
随着宽带互联网的迅速发展,网络规模在不断扩大,网络结构日渐复杂,网络业务日趋丰富,网络流量高速增长。电信运营商及企业网管理人员需要借助可靠、有效的网络业务流量监测系统对
学位
以九十年代的工作流技术为起点,业务流程管理技术发展到现在已经得到了普遍的应用,市面上也出现了很多优秀和成熟的业务流程管理的产品。但是这些业务流程产品往往重视工作流自
随着计算机技术的发展,流数据应用越来越普遍。传感器网络中存在很多分布式流数据。流数据应用场景对实时处理分析有更高的要求,需要研究高效可扩展的流连接模型。由于分布式流
在机器学习和数据挖掘应用中,为训练数据收集类别、属性等标签信息往往是一项繁重且开销昂贵的工作。近年来,“众包”模式的出现为这个问题带来了转机,例如在亚马逊Mechanical T
本文重点研究高维大样本多类别的大规模学习问题,就前向多层神经网络的原理和应用进行了如下探讨: 1.针对高维大样本的学习问题的复杂性及在实际应用中的可行性,提出任务分
普适计算(Pervasive/Ubiquitous Computing)是继主机计算、桌面计算之后发展起来的一种新的计算模式,其本质特征是信息空间和物理空间的融合,并且计算对人是透明的。智能空间
近年来,随着Internet技术和企业信息化建设的发展,构建基于Web的应用系统的需求越来越复杂,开发周期越来越紧迫,因此,如何使企业信息系统软件具有开发时间短,且高可用性、高可靠性,
学位