论文部分内容阅读
随着计算机技术的迅速发展,符合人际交流习惯的手势识别成为人机交互中的一项关键技术,基于视觉的手势识别是当前涉及图象处理、模式识别、计算机视觉等领域的一个比较活跃的课题.由于手势本身具有的多样性、多义性以及时间和空间上的差异性等特点,使此方向研究成为一个极富挑战性的多学科交叉研究课题.该文主要研究复杂背景下的手势跟踪以及轨迹识别,手势跟踪就是从图像中识别出手及其运动,轨迹识别则是按照某种规则识别出手势表达的含义.该文提出了一种基于颜色概率模型并融合运动信息进行手势跟踪的新方法,即改进的CAMSHIFT算法,其基本思想是:将图像序列通过一个肤色概率查找表转换为肤色概率分布图,结合运动信息和肤色概率分布,初始化一个搜索窗的大小和位置,然后对肤色概率分布图进行迭代运算,定位出手势的位置和大小,根据计算肤色概率分布图中手势区域的2阶矩,最终确定感兴趣区域的长度和宽度.实验表明,该文提出的算法提高了抗噪性能,避免了错误跟踪,并且跟踪准确精细.该文还给出了实时手势跟踪系统的实现,并对其做了性能测试.动态轨迹识别主要有两个难点:第一是手势分割的模糊性,即如何在人手运动轨迹中选取手势的起始点与结束点;第二是手势的时空易变性,即手势轨迹不但空间上不同而且持续时间也不相同,即使是同一种手势.该文使用从左到右(left-to-right)的离散隐马尔可夫模型(DHMM)对手势轨迹进行建模、训练及识别.为了有效区分未定义手势与已定义手势,该文在文献[8]基础上提出了一种改进的阈值模型方法,较好的解决了这个问题,并给出了一种从人手运动轨迹中定位起始点与结束点(Gesture Spotting)的方法.实验结果表明,对六种孤立手势平均识别率达到95.2﹪;引入该文提出的阈值模型后,在有未定义手势干扰的情况下,六种孤立手势平均识别率达到95.3﹪;利用该文给出的手势定位方法,对连续手势的有效识别率达到91.1﹪.最后,该文对轨迹识别进行了实时性研究,给出了一种实时手势识别系统的方案,并对几种控制手势给出了演示系统.