论文部分内容阅读
人体视觉分析是近年来计算机视觉领域中备受关注的前沿方向,它在虚拟现实、视觉监控等领域均有着广阔的应用前景。本文的研究工作是人体视觉分析中的基于单帧图像的姿态识别与分析,目的是使计算机从单目视频中捕获完整的前景运动人体后,在一帧二值映射图中提取出人的姿态特征,通过模式识别达到认知人类常规姿态的智能效果。本文首次提出了一种基于角度的人体姿态特征提取算法(Angle-based Feature Extraction, AFE)和一种适用于姿态分类的扩大类间离散度的相似距离(Similarity of Larger Scatter between Sorts, SLSS)。在特征提取部分,本文首先研究了基于空间变换的特征提取算法(FEET),分析了它在特征空间变换过程中的计算复杂性;然后对Robert T. Collins 的基于极点信息的特征提取方法(FEEP)进行了算法设计与描述,并阐述了其特征向量维数不统一可能造成的识别局限性;总结以上方法的不足,本文设计了AFE算法。该算法思想是基于人体特征角度对原始特征向量进行统一和降维,从而减省归一化和特征空间变换的计算。它的优点是能够有效地识别到对应的人体部位,保证姿态的识别分类的鲁棒性;在目标边界象素数目较大的情况下,具有较小的计算代价。同时,基于单帧的AFE 也为基于序列帧的人的行为理解提供了一种新的时变特征的可行方案。AFE 算法的局限性是对噪声比较敏感,并且要求前景移动物体的完整性,即遮挡处理(Occlusion Handling),这是也是迄今为止大部分人体视觉系统不能很好解决的问题之一。在分类识别部分,本文对传统的欧式距离(Euclidean Distance)进行改进,提出了一种扩大类间离散度的相似距离SLSS,即在类间距的计算中对n 个类别的向量分别赋予所属类的权向量,以突出类别之间的特征差异,使得n 类之间的可分性最大化(即类间距离的最大化)。不同的是,线性判别函数是采用唯一的最佳权向量进行操作,而SLSS 则通过n 个不同类别的权向量来扩大类间离散度,保证了分类识别的最大有效性。该算法无需进行样本训练,操作简单,易于实现,但是它要求样本指标具有多峰性质且互相交错,这恰恰适用于人体不同姿态分类的情况。