【摘 要】
:
随着电子技术的飞速发展,计算机及智能设备走进千家万户,自动驾驶及智能控制走进大众生活。在所有智能交互的方式中,手势识别是最自然的人机交互逻辑。近年来计算机视觉等技术迅速发展,脱离数据手套繁琐设备而采用摄像头简单设备的手势识别成为其主流的应用方式。尤其是深度学习在图像识别领域展现出了强大的数据分析能力,基于深度学习的手势识别技术成为了研究热点。相比于二维图像,动态手势视频具有更高的数据量,其是一种更
论文部分内容阅读
随着电子技术的飞速发展,计算机及智能设备走进千家万户,自动驾驶及智能控制走进大众生活。在所有智能交互的方式中,手势识别是最自然的人机交互逻辑。近年来计算机视觉等技术迅速发展,脱离数据手套繁琐设备而采用摄像头简单设备的手势识别成为其主流的应用方式。尤其是深度学习在图像识别领域展现出了强大的数据分析能力,基于深度学习的手势识别技术成为了研究热点。相比于二维图像,动态手势视频具有更高的数据量,其是一种更具挑战性的手势识别分类任务,提取繁琐的手工特征在动态手势视频中具有更大的难度和更高的应用成本。本文基于深度学习,研究动态手势视频中手势时空特征的提取及其有效融合办法。针对手势时空特征的提取,本文提出了基于膨胀卷积理论的时空多尺度特征提取。而后通过卷积门控循环单元进一步融合动态手势的短期时空特征,并基于此对卷积门控循环单元进行改进,提出压缩手势空间特征的门控循环单元结构变体,减少模型参数量的同时提高了手势时序特征的融合能力。本文还进一步研究了 RGB-D两种数据模态下手势识别的技术方案,针对手势识别过程中的手部检测及视频关键帧提取流程,本文提出了基于视频输入的手势时空注意力机制数据处理方法,提高了模型对视频中手部关键位置的关注度,同时将迁移学习的方法应用于RGB-D双模态的手势识别技术中,提升了单模态的手势识别精度以及双模态的手势识别结果。为了验证本文方法的有效性,本文在Jester和ChaLearn LAP IsoGD两个大型数据集上进行了多组对比实验及分析,结果表明本文提出的方法解决了动态手势时空特征提取及融合的一些有效性问题,在手势定位、单模态及双模态的手势识别中具有良好效果,获得了较高的识别准确率。
其他文献
目的 为了确定维生素K2对绝经后骨质疏松症(postmenopausal osteoporosis,PMOP)患者的预防和治疗作用,对22项随机对照试验进行了荟萃分析.方法 在PubMed、Cochrane Library、Embase数据库和三个中文数据库(CBM、CNKI和万方)检索了2020年6月1日之前发布的相关随机对照试验(RCT),以维生素K2与安慰剂或其他抗骨质疏松药物预防和治疗PMOP进行比较.使用固定效应或随机效应模型计算合并风险比(RR)、平均值(MD)和95%置信区间(CI).结果
目的 揭示成骨分化中内源性竞争性长链非编码核糖核酸lncRNA(long noncoding RNA,lncRNA)与下游潜在的微小核糖核酸(micro-ribonucleic acid,microRNA,miRNA)及信使核糖核酸(messenger RNA,mRNA)的表达关系,构建内源性竞争性lncRNA-miRNA-mRNA网络.方法 选取NCBI基因表达综合数据库基因芯片GSE89330、GSE72429、GSE74837,应用GEO2R获得差异基因(differentially express
不法分子获得用户在线分享的图像作为输入提供给网络上公开的图像转换模型来生成伪造的图像或视频,给国家安全、社会稳定和个人隐私等构成潜在威胁。因此,需要相关技术来降低用户在线分享的图像被用于图像转换模型伪造的风险。对抗攻击技术通过向原始图像中添加人眼不可感知的微小扰动来生成对抗样本,如果将添加了微小扰动的对抗图像作为图像转换模型的输入会让图像转换模型输出结果偏离预期,生成的图像含有明显的扭曲或变形,从
随着电子商务的发展,物流已经与人们的生活密切相关,物流业的发展也成为衡量国家现代化发展程度和综合国力的重要标志之一。目前在物流中心,仍需要通过人工方式拣选货物,然而使用人工拣选不仅效率低且具有不稳定性,如在疫情期间很多工人不得不在家进行隔离,给复产复工带来了麻烦,极大地限制了物流运输效率。为了解决在物流场景下通过机器代替人工提高拣选效率的问题,本文设计并搭建了移动机械臂拣选系统用于代替人力完成面向