基于视频相似性的动态手势识别技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:aini143
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
手势是信息传递的一种媒介。手势识别技术是指识别由人手,包括手臂组成的行为和动作,在人机交互、手语语言识别、体感游戏、智能设备操控等方面都有着重要的应用。研究动态手势识别技术能提高人们的生活质量、推动图像识别领域的发展。动态手势指的是手部的表观形状或空间位置随着时间推移产生变化的手势序列。为了解决传统视频处理采样方式和关键帧选取的不足之处,本文提出了基于视频相似性的动态手势识别技术。主要贡献总结如下:(1)提出了基于孪生网络的相似性度量模型。衡量动态手势视频内部帧与帧之间的相似性,减少背景帧和冗余帧在动态手势序列中的影响,尽可能增加对手势类别识别有帮助的帧在输入帧中的占比。由于孪生网络的训练需要大量具有标签的正负样本对,本文设计了简单有效的图像正负样本选取方法和基于弱监督的代价函数,利用图像表观相似性和图像类别信息提高模型对动态手势的表达能力。(2)提出了基于相似性度量模型的关键帧提取算法,包括在线的基于手势序列分解的关键帧提取算法和离线的基于kmeans时间聚类的关键提取算法。在相似性度量模型的基础上,基于手势序列分解的关键帧提取算法是指,划分当前帧和已有内容簇的相似性。基于kmeans时间聚类的关键提取算法是指,在相邻时间窗口进行相似性搜索,由此将一个视频的所有帧划分为K个内容簇,在同一个内容簇的视频帧表达的信息相近,不同内容簇的视频帧表达的信息各异。本文研究的基于视频相似性的动态手势识别技术,具体地,为了解决传统视频处理采样方法的缺点,利用基于孪生网络的相似性度量模型衡量动态手势视频内部帧与帧之间的相似性,并设计了基于相似性度量模型的关键帧提取算法。由此对动态手势的变化精准建模,增加系统的鲁棒性。本文提出的方法在NVIDIA数据集的识别精度为72.4%,相较于基准2DCNN方法提高了4个百分点,在SKIG数据集的识别精度为98.1%。
其他文献
患儿,男,9岁,体重30 kg,主因“双前臂旋后畸形9年”入院。既往体健,否认药物过敏史,足月顺产,否认神经系统疾患,无家族遗传史,无外伤手术史。查体:体温(T)36.5℃,脉搏(P)89次/min,呼吸(R)20次/m
<历史教学>2005年1期刊登了刘俊利先生的<基于实践的研究性学习反思>,文章在肯定研究性学习的同时,认为还存在许多理论认识和实际操作问题.
桂花是一种绿化、美化、香化三者密切结合,观赏和使用兼备的优良园林树种,也是中国传统的芳香植物,为常绿乔木。其不仅是名贵的园林观赏花木,而且是香料工业、食品工业、药材
<正> 大地湾遗址位于甘肃省秦安县城东北45公里处,五营乡邵店村东部及其相邻地带,东距陇城乡7公里,西去莲花乡11公里(图一)。遗址主要分布在渭河二级支流清水河南岸的阶地以
物联网被称为继计算机、互联网后的信息产业的第三次浪潮,随着近年来的快速发展,物联网技术在很多领域得到了广泛应用。物联网利用互联网技术将物理世界中的各类设备连接,使
小麦作为我国的主要粮食作物之一,近年来种植面积得到了大面积的推广,但是,小麦病虫害始终是制约小麦产量和质量提高的主要因素,因而做好小麦病虫害防治工作,提高小麦病虫害
<正> 纳米比亚原名西南非洲。在沦为殖民地前,这里分散居住着班图、霍屯督和布须曼人各部落,没有形成统一的国家,也没有统一齣名称。殖民主义者因其位于非洲的西南部而称之为
神经前体细胞表达发育调控样基因(Nedd4L)所编码蛋白属于泛素连接酶E3,其对胞内蛋白的泛素化和降解过程至关重要,涉及到Nedd4L的作用方式以及活化与调节。越来越多的研究提示
目的检测乙型肝炎肝硬化患者血清胃促生长素(Ghrelin)和瘦素(Leptin)水平变化,并探讨其与胰岛素抵抗的关系。方法在Child A级(n=33)、B级(n=32)和C级(n=32)乙型肝炎肝硬化患
革命的本质是一种结构的替代,中国革命后建立的新生政权意味着国家政治形态开始从传统向现代的转型,中国社会各个层面出现了一种结构性的巨变。经济结构开始从传统落后的形态