基于深度学习的静态手势识别

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:InsideASPNET
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能设备的发展,手势作为一种人机交互手段,具有丰富、灵活、直观的特点,以手势作为人机交互的方式更符合人们的生活习惯。手势识别对于帮助聋哑群体融入正常的社会生活、机器控制、安全驾驶等方面都有着重要意义。其中,基于数据手套、Kinect等外部设备的手势识别技术已经相对成熟,并被广泛应用,但基于计算机视觉的手势识别技术依然不够成熟。传统图像处理方法通常为了避免环境影响,而选择在简单或单一背景下进行算法的研究设计,导致算法的实际应用价值不高。在复杂背景下,本文以提高手势检测速度和检测精度为目的,采用了不同的方法进行手势识别的研究与改进,并通过实验对比,分析各种算法在手势识别中存在的问题及产生的影响,最终改进的YOLOv3深度学习模型可以在保证手势检测精度的前提下,达到对手势的实时检测,具有良好的应用价值。本文主要采用了 3种方法对手势识别进行了研究:(1)针对传统图像处理算法对于有手臂、人脸等类肤色区域干扰无法进行有效分割,传统滑窗检测法生成大量的窗口图片而影响算法处理速度的问题,提出采用肤色分割提取类肤色区域,对类肤色区域按照自定义的图像缩放规则构建图像金字塔结构,并结合滑窗操作,生成窗口图片,对每个窗口图片进行目标识别和分类识别,这种改进使算法的处理速度达到了 25fps/s,使用范围扩大,手势识别精度达到了 61.2%,检测精度不高。(2)采用Faster RCNN深度网络模型进行手势识别的研究,针对Faster RCNN对远距离小目标手势的识别率不高的问题,运用Faster RCNN与FPN算法结合,提高小目标的检测精度,该模型虽然检测精度较高达到了 97.6%,但检测速度很慢(2fPs/s),无法达到实时检测。(3)采用YOLOv3深度网络模型进行手势识别的研究,针对YOLOv3存在对于近距离手势目标框定位不准确,当IOU增大时,性能下降的问题。提出重新对实验数据进行k-means聚类,生成适应本文数据集的先验框大小,去除顶层特征图对目标的预测,以提高目标手势的定位精度。最终该模型检测精度达到了 98.6%,检测速度为22fps/s,可以达到实时检测的效果。
其他文献
在初中阶段的学习中,学生需要记忆的知识较多,教师在教学当中也会发现学生本来记住的知识经过一段时间就又忘记了,初中历史的学习也是如此。为了适应学生学习历史的需求,知识
目的:1.了解手术室护士关怀能力的整体状况。比较和分析不同工作年限、不同初始学历等护士的关怀能力水平与特点。2.探索手术室护士关怀能力和心理健康状况以及工作疲溃感的相
语言禁忌是世界各国各民族中普遍存在的语言现象,受宗教和皇权影响的泰国,也有着丰富的语言禁忌。本文通过对收集的丰富语料进行综合分析,把语言禁忌分为话题类语言禁忌、宗教类
目的:评价老年人根管充填应用改进的连续波热牙胶根充法的充填质量和效率。方法:213名需要根管治疗的老年口腔患者,共计238颗患牙,按照根管充填方法的不同分为热牙胶组和冷侧压组
对浙江省东南部台州、温州、宁波及绍兴4个地区25份杨梅地方品种材料叶片的气孔特性进行研究,测定了气孔密度、气孔面积、气孔长、短轴和气孔器长、短轴。结果表明:所有材料
<正>"单身贵族"是个令人向往的称谓,代表着自由、活力和尊贵。然而不知从何时起,这个词逐渐被"单身潮"所替代。有统计数字表明,目前北京、上海、广州等各大城市的"单身"数量
期刊
违法建筑作为现代社会发展尤其是城市化过程中产生的一种事物,对社会的健康发展产生诸多消极影响,国家对违法建筑进行治理符合国家利益和公共利益的要求。违法建筑的违法性主
疾病的有效防治以及如何评价治疗性研究的价值是临床医生十分关注的问题.对治疗性研究应该按照循证医学有关预后文献评价原则,进行治疗性研究的真实性、临床重要性和实用性评