论文部分内容阅读
随着我国计算机技术的迅猛发展,人们对计算机使用方便程度的要求越来越高,手势是一种自然而直观的人际交流模式。已经成为一种重要的人机交互方式。基于视觉的手势识别是实现新一代人机交互所不可缺少的一项关键技术。然而,由于手势本身具有的多样性、多义性、以及时间和空间上的差异性等特点,加之人手是复杂变形体及视觉本身的不适定性,因此基于视觉的手势识别是一个极富挑战性的多学科交叉研究课题。手势分为动态手势和静态手势,动态手势定义为手运动的轨迹,而静态手势强调通过手型传递一定的意义。本文从手势的分割、手势的特征提取和识别三个方面对静态手势识别算法进行了研究。手势的分割是所有手势识别系统的第一步也是最为重要的一步,分割的效果直接影响到后续的识别结果。本文提出了一种新的基于LM_BP神经网络的手势分割方法。这种方法不需要进行色彩空间的转换,不需要考虑肤色在色彩空间的聚类效果,只要训练样本足够丰富,便可以通过神经网络对肤色在颜色空间的分布进行精确的描述。训练后的网络可以将人体的肤色信息从复杂背景中较好的分割出来。在手势图像的特征提取和识别部分,本文首先采用八邻域搜索法对二值化的手势图像进行边缘检测,得到连通的手势外轮廓,然后分析了具有旋转、平移和尺度变换不变性,并且与边界的起点位置无关的归一化傅立叶描述子,并把归一化傅立叶描述子及欧式距离应用于字母手势的识别中,通过计算输入手势的归一化傅立叶描述子与样本库中各类图像的特征向量的欧式距离,判定输入图像与样本图像间的匹配程度,把待识别的输入图像归为距离最小的那一类。实验结果表明,提出的方法对复杂背景中的字母手势识别率可达到88.46%,可实时识别。