基于视觉的手势检测与识别算法及其在人机交互中的应用

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:amao01010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人机交互技术向着“以人为中心”的多媒体、多模式交互的方向发展,传统的基于键盘、鼠标的交互方式越来越显示出自身的局限性;将基于计算机视觉的手势识别方法融入到新一代人机交互模式中,成为完善人机交互手段的一种新的思路。本课题面向人机交互应用,针对复杂背景下交互手势的检测方法、手势的特征描述方法、手势识别方法做了深入研究,并在上述研究基础上选取虚拟现实环境为应用背景,建立了一个基于用户手势输入的虚实交互系统,实现了人机之间的友好交互。在手势检测方面,针对实际应用中背景复杂多变的特点,提出基于肤色分割前端优化的Viola-Jones手势检测方法。为排除光照强度变化的影响,在肤色分割模块中实现了在非线性转换YCbCr颜色空间中的手势建模。肤色分割模块的引入,有效地解除了复杂背景对手势检测问题的制约,在一定程度上降低了算法的误检率。在算法实现环节分别通过复杂背景下测试、分类器性能测试、实时性能测试对上述方法进行验证,实验结果表明本文方法对复杂背景下的手势检测较为鲁棒,表现出良好的整体性能。在手势识别方面,选取Hu不变矩作为手势的特征描述,提出结合Hu矩特征和支持向量机(SVM)分类的手势识别算法。Hu矩特征不易受噪声干扰,对检测手势在尺度、旋转角度等方面的变化有较强的适应性。实验环节中上述识别方法在测试样本集上取得了理想的识别率,从而进一步证明选取SVM用于特征分类,可有效地解决手势识别研究中面临的小样本、分类模型推广能力差及参数难以优化等问题。最后在上述研究基础上,将手势检测算法与识别算法结合,实现了对输入手势的自动识别,并选取虚拟现实环境为应用背景,在Visual C++ 6.0环境下建立了一个以用户手势为输入的虚实交互系统,利用对用户手势的识别结果控制虚拟环境中的物体,从而实现了人与虚拟环境的实时、友好交互。
其他文献
在线视频网站如优酷、爱奇艺、搜狐大多采用Adobe公司提供的通用的FlashPlayer平台,因此用户在线观看视频时,不需要下载不同的解码软件对视频解码播放。据调查了解,Flash Pla
关键节点的测度问题本质上可归结为节点重要性测度及排序问题,该问题的有效解决有助于指导金融、电力、供应链、互联网等多方面的应用开展。而当前的研究大多针对无权、静态
关系人分析主要是从海量通信数据中分析出人与人之间的潜在的关系模式,为其他分析系统提供决策支持。将数据挖掘技术应用到关系人的分析中能更容易的挖掘出隐藏在数据中的信
摄像机标定是利用标定物体的二维图像信息和真实测量的三维空间信息来计算摄像机标定参数的过程。获得精确的摄像机标定参数是实现双目视觉系统的前提,使用摄像机标定参数矩
基于对象的存储是一种新的网络存储模式,它融合了SAN的高性能和NAS的跨平台两个优点,发展前景广阔。它将90%左右的数据管理下移动智能存储设备,缓解了元数据服务器和文件系统
基于参考图像的乳腺肿块计算机辅助诊断(Computer-aided diagnosis, CAD),不仅提供待诊乳腺图像可疑肿块的决策值,指示其为肿块的可能性,而且提供一系列与待诊图像相似的确诊
拥塞控制技术(Congestion Control Technology)是针对网络拥塞问题而提出的有效解决方案。在计算机科学、控制理论、运筹学等学科的交叉领域,拥塞控制成为增强系统整体性能的
随着计算机网络和多媒体信息的迅猛发展,用户的检索需求在不断变化,用户不再满足于文本检索,多媒体信息的检索备受关注。当前已有的多媒体个性化模型大多是基于用户检索词建
随着无线传感器网络技术的发展,其应用领域也日益广泛。然而,由于应用需求的多样性和无线传感器网络平台的异质性(不同的硬件结构、通信协议和操作系统),传感器网络应用的开
在普适多媒体计算环境下,由于不同接收终端有着不同的屏幕尺寸,无线视频网络在传输前需要对视频分辨率进行转换。空间分辨率转码是解决此问题的一种有效途径。为了减少计算量