论文部分内容阅读
基于视频的人体行为分析是指对于一段视频序列中运动人体的行为进行自动分析的技术。近年来,它成为计算机视觉领域的研究热点问题。基于视频的人体行为分析是计算机视觉研究领域的一个热点,其在智能视频监控、体育及娱乐运动分析、人机交互、虚拟现实以及视频检索等方面具有广阔的应用前景。由于人体运动本身的复杂性以及周边环境的多样性,使人体行为分析充满了难度与挑战。因此,研究基于视频的人体行为分析具有重要的学术价值和现实意义。
本文围绕基于视频的人体行为分析的相关问题展开研究,主要分为三个部分:目标检测、特征提取及行为识别。
1)在运动目标检测方面,论文在分析对比光流法、帧间差分法、背景减除法等常用运动目标检测方法的基础上,提出了一种改进的轮廓提取算法。采用混合高斯模型建立背景模型,通过参数更新来适应场景的变化,通过背景减除方法得到运动前景,同时用Canny算子对进行全局边缘提取,然后将两种方法得到的二值化图像进行逻辑“或”运算,最后经过形态学处理,得到完整的运动目标及其轮廓。
2)在特征提取方面,本文从特征融合的思想出发,寻找一种既包含目标人体运动信息,又能反映人体外形特征的优良特征描述符。方向梯度直方图(Histogram of Oriented Gradient,Hog)可以描述视频中图像帧中人体的区域运动信息,而Hu不变矩可以反映人体外形轮廓信息,因此本文将Hog特征与Hu不变矩特征进行融合,得到一种基于特征融合的PCA-Hog-Hu特征描述子。这个特征描述子不仅包含了人体的外形轮廓信息,同时也融合了人体运动行为过程中的区域运动信息,是一个优良的特征描述子,为论文后续过程中人体行为的分类打下了良好的基础。
3)在人体行为识别方面,本文采用基于径向基核函数的多分类支持向量机对人体行为进行分类与识别,采用k-cv交义验证方法进行验证。
本文开发平台为Microsoft Visual Studio2010,在OpenCV计算机视觉库基础上编程,采用Weizman视频数据库中的多段视频对本文算法的准确性与实时性进行了测试。研究表明,本文的算法能够实时地对运动人体进行检测并进行准确地行为识别。与基于单一的Hog特征或Hu不变矩特征的行为识别方法相比,本文算法在特征提取的时间开销上略高于Hu不变矩特征提取,与Hog特征提取相近,而在分类性能上,本文算法的适用范围更广,平均识别率更高,对于某些场景下特定人体行为的识别更有效。
本文围绕基于视频的人体行为分析的相关问题展开研究,主要分为三个部分:目标检测、特征提取及行为识别。
1)在运动目标检测方面,论文在分析对比光流法、帧间差分法、背景减除法等常用运动目标检测方法的基础上,提出了一种改进的轮廓提取算法。采用混合高斯模型建立背景模型,通过参数更新来适应场景的变化,通过背景减除方法得到运动前景,同时用Canny算子对进行全局边缘提取,然后将两种方法得到的二值化图像进行逻辑“或”运算,最后经过形态学处理,得到完整的运动目标及其轮廓。
2)在特征提取方面,本文从特征融合的思想出发,寻找一种既包含目标人体运动信息,又能反映人体外形特征的优良特征描述符。方向梯度直方图(Histogram of Oriented Gradient,Hog)可以描述视频中图像帧中人体的区域运动信息,而Hu不变矩可以反映人体外形轮廓信息,因此本文将Hog特征与Hu不变矩特征进行融合,得到一种基于特征融合的PCA-Hog-Hu特征描述子。这个特征描述子不仅包含了人体的外形轮廓信息,同时也融合了人体运动行为过程中的区域运动信息,是一个优良的特征描述子,为论文后续过程中人体行为的分类打下了良好的基础。
3)在人体行为识别方面,本文采用基于径向基核函数的多分类支持向量机对人体行为进行分类与识别,采用k-cv交义验证方法进行验证。
本文开发平台为Microsoft Visual Studio2010,在OpenCV计算机视觉库基础上编程,采用Weizman视频数据库中的多段视频对本文算法的准确性与实时性进行了测试。研究表明,本文的算法能够实时地对运动人体进行检测并进行准确地行为识别。与基于单一的Hog特征或Hu不变矩特征的行为识别方法相比,本文算法在特征提取的时间开销上略高于Hu不变矩特征提取,与Hog特征提取相近,而在分类性能上,本文算法的适用范围更广,平均识别率更高,对于某些场景下特定人体行为的识别更有效。