基于机器视觉的手势检测与跟踪技术研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:sakurzhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能交互技术在各个领域的广泛应用和不断发展,手势交互凭借其自然且灵活的特点,越来越具有研究和应用价值。机器视觉主要以图像作为媒介,实现机器对外界信息的智能处理,近年来机器视觉得到了爆发性发展。基于机器视觉的手势交互是当前人机交互的研究热点,而准确且高效的手势检测和跟踪是其实现基础。随着手势交互技术应用场景的复杂化,现有的手势检测和跟踪方案已经难以满足复杂应用场景中对高准确率和高实时性的要求。因此,本文针对目前存在的主流手势检测和跟踪方案展开研究,设计了三个具有更好性能的手势检测或跟踪方案。本文的主要工作如下:1)为了得到一个兼顾高准确率和高实时性的手势检测算法,设计了一种基于YOLOv3网络进行改进的方案。首先使用K-means++算法对手势数据集进行聚类,得到一组更准确的先验框初始值,这有助于网络快速地收敛,并得到全局最优解;然后引入Focal Loss损失函数改进原来的置信度损失,避免了网络对大量简单样本的无效学习过程,这不仅加快了网络的训练速度还提高了对困难样本的检测效果;最后设计了一种基于位置判别的候选框去冗余模块,并将其融入到加权NMS算法中。相较于传统的NMS算法,提出的算法不仅有效地综合了多个高置信度候选框信息,还有效地去除了冗余的预测结果。2)为了实现手势的快速跟踪并兼顾较高的准确率,设计了一种基于Staple算法进行改进的手势跟踪方案。首先结合手势的特点提出了一种精简的CN特征,在不影响跟踪准确率的基础上有效地减少特征的复杂度;然后将精简的CN特征及FHOG特征结合求取相关滤波响应,并在响应阶段与颜色直方图特征响应进行融合。这种特征融合方案不仅考虑了局部的纹理信息还考虑了全局的颜色信息,能够有效对抗手势变形和同义背景等干扰。3)为了实现手势的高准确率跟踪并满足实时性要求,设计了一种基于Siam RPN++算法进行改进的手势跟踪方案。首先细化了训练样本的分类,将负样本对进一步分成简单负样本对和困难负样本,其中困难样本对包含了跟踪过程中常见的同义背景干扰。这种训练方式有效地加强了算法抵抗同义背景干扰的能力;然后将Updatenet网络整合到跟踪框架中,实现神经网络自适应地更新模板。这种模板更新方式能够学习到更加复杂的目标运动规律,而且相较于线性更新方式更不容易产生初始模板信息丢失或者模板误差累积等问题。为了验证以上改进措施得有效性。首先重新生成Egohands数据集的标签,用于手势检测的训练和验证;然后选取部分jester数据集进行逐帧的手势标注,用于手势跟踪的训练和验证;最后自建手势数据集,用于测试改进算法在实际场景中的性能。
其他文献
随着芯片集成度的不断提高,金属氧化物半导体场效应管(MOSFET)在尺寸缩小的过程中受到短沟道效应的制约,三维MOS器件鳍式栅场效应晶体管(FinFET)和圆柱形双栅场效应晶体管(CSDG MOSFET)通过增加栅极对沟道的控制面积来提高栅控能力,从而提高输出电流及对短沟道效应的抑制能力,是未来器件的发展方向。因此,建立FinFET和CSDG MOSFET的模型,研究它们的电学特性规律,对更好地理
脑卒中是一种常见的急性脑血管疾病,卒中后大部分患者会出现上肢功能障碍,目前患者功能康复的主要方式是康复训练。研究表明,相比于传统康复训练方式,机器人辅助训练可以提供多模式化的训练方案,有效提高脑卒中患者的康复训练效果。由于人体上肢康复训练比下肢训练更加复杂,肢体运动功能恢复更慢,因此,研发上肢康复机器人具有重要的研究意义和临床价值。目前,在上肢康复机器人结构设计方面,外骨骼式上肢康复机器人因其能更
随着工业化的发展与城市化的推进,电力电缆因体积小、安全性高和抗干扰性强等优点而被广泛应用于电力传输和电力分配。然而,由于受到生产工艺、土壤条件和运行时间等多种因素的影响,电力电缆绝缘会出现局部劣化,从而引发闪络、局放等现象,最终导致电缆永久性故障。因此,研究电缆早期故障的检测和识别方法,及时维护和更换存在绝缘缺陷的电缆,对提高电力系统的安全性和稳定性具有重要意义。在对电缆早期故障进行检测和识别的研
射频功率放大器是射频前端的关键器件,也是射频前端中消耗功率最大的器件,低效的功放会浪费能源,且发热严重,降低射频前端性能。另外,随着无线通信技术的发展,通信信号调制方式愈发复杂,信号带宽越来越宽,信号的峰均比越来越高。因此在射频前端中,功放需要宽带宽,高功率效率和高回退效率。Doherty功放因其硬件电路实施简单,是无线通信设备中的最常用的效率提升技术。基于上述背景,本文对宽带功放和Doherty
氧化锆陶瓷具有高强度、高硬度、低热传导率、高耐腐蚀性能以及优良的生物相容性等优点,在医疗器械、汽车配件和航空航天等领域均有广泛应用。其中,医疗手术刀具是一种全新领域的应用。但是使用氧化锆陶瓷制备手术刀存在以下两个问题:(1)氧化锆陶瓷特性决定了它缺乏类似金属的塑性变形能力,断裂韧性较差;(2)氧化锆陶瓷存在低温老化现象,而医疗刀具涉及到的高温蒸汽灭菌消毒过程以及湿热的应用环境要求氧化锆陶瓷具有良好
工程项目交易方式的选择是业主在项目前期的一项重要决策,它在很大程度上关系着项目的成败,因此对工程项目交易方式选择进行研究具有重要的现实意义。本论文尝试建立影响工程项目交易方式选择的指标体系,引入随机森林算法构建基于项目数据的工程项目交易方式决策模型。旨在从理论上扩展现有工程项目交易方式选择的研究思路和方法,并在实践上帮助业主选择合适的工程项目交易方式。本文主要研究包括三部分内容:首先,构建工程项目
铬渣是一种强碱性的危险废物,其中含有的六价铬毒性高、迁移性强,给环境安全和人体健康带来巨大威胁。其传统的处置方法一是还原固化后填埋,一方面,铬在锰氧化物或嗜锰细菌的长期氧化作用下会重新释放到环境中,造成二次污染;另一方面,填埋也是对铬资源和土地资源的极大浪费。二是酸性浸出/碱性焙烧以提取铬,但由于选择性差、提取率低等缺点并未得到广泛应用。因此,传统的处置方法并不能彻底还原/提取铬渣中的六价铬。究其
电镀污泥是化学沉淀法处理电镀废水过程中产生的一种典型危险固体废物,其所包含的重金属(铬、镍、铜、锌等)既对环境存在巨大的危害,同时也是重要的金属资源。因此,电镀污泥中重金属的提取对环境保护和资源回收具有重要意义。电镀污泥通常是多种金属离子共存,采用传统的浸出法难以实现重金属的高效、高选择性提取。同时,浸出液中多种金属离子共存将大大增加了重金属再利用的难度。常见的电镀污泥中主要物相为碳酸钙、硫酸钙,
纳米药物载体的发展为肿瘤治疗提供了新的策略。其中,药物与载体分子相结合的前药载体能够有效提高药物的溶解性和体内循环稳定性,避免药物过早释放,并通过被动靶向增加肿瘤部位药物富集量,降低全身性毒副作用。此外,前药载体的药物释放可以通过设计药物与载体分子之间的连接体加以控制,比如肿瘤微环境响应型连接体能够针对肿瘤微环境的特点(比如,谷胱甘肽含量高)实现响应变化,快速释放药物。铜对肿瘤发生发展和肿瘤部位血
结构系统的模态参数识别是结构健康监测的重要组成部分,主要通过结构振动响应数据如加速度、位移等分析得到。这些数据通常由安置在结构上的传感器获取,安装繁琐且耗时,监测也多有不便。近年来,随着图像数据采集和计算机视觉技术的发展,视频监测逐渐成为结构响应监测的一种高效方法。然而,目前结构视频监测技术一般要求使用高速相机在理想环境中进行,针对现实环境的适应性较差。针对以上问题,本文研究一种综合解决方案,提出