基于Wi-Fi CSI的跨场景手势识别算法研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:didierda
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
与人脸识别、语音识别一样,手势识别也较常见,广泛应用于日常生活,具有很高的应用价值。已有的识别方法是视频成像、佩戴设备或无线装置,其中前两种在精度和效率上都较高,但受限于环境或隐私。而无线识别中基于Wi-Fi信道状态信息(Channel State Information,CSI)的识别方法则没有这些限制,有利于手势识别研究。但是,在跨场景手势识别问题中,每个不同的场景均需大量的数据样本来完成高精度的识别工作,而Wi-Fi设备的信号传输极易受到外界影响,不同场景的布局等都会对信号记录产生极大的影响,使得对于新场景手势识别需要较多样本。因此,本文通过使用Wi-Fi CSI数据进行极少数样本下的跨场景手势识别的研究,主要工作如下:(1)针对于长序列CSI信号数据由于手势连续性以及设备记录等因素引起的漏检误检问题,提出了一种基于双阶段定位的Wi-Fi CSI手势片段分割方法。该方法首先对每个时间单位数据计算手势概率,再经过数据平滑处理,去除异常值并将不同手势片段分隔。其次,通过随机候选框结合非极大值抑制以及精确回归,再确定每个手势片段的位置。经过实验验证,该方法在已有手势数据上可以达到98%的分割精度。(2)针对现有的跨场景手势识别问题中不同场景间手势通用特征难提取问题,提出了一种基于信息融合的多场景通用手势特征提取算法。该方法首先采集场景信息并进行偏移修正。其次,该方法通过计算数据的多维信息扩充手势信息占比。最后,通过在提取特征过程中改变不同特征权重进一步获取通用手势特征。经过实验验证,该方法可以有效学习多场景通用手势特征,同时提升跨场景手势识别性能。(3)针对现有的跨场景手势识别问题中目标场景需要较多样本进行训练的问题,提出了一种基于嵌套双分支网络的跨场景手势识别算法。该方法首先对源场景和目标场景的手势配对,然后通过内部双分支结构提取手势的时空特征,再通过外部双分支结构计算手势样本配对的相似程度,在极低的目标场景数据代价下有效的提升识别精度。经过实验验证,该方法在跨场景手势识别问题上可以达到96%的识别精度。从上述的工作中可以看出,本文的方法使用Wi-Fi CSI数据在跨场景手势识别任务中具有较高精度和鲁棒性,可有效应用于现有生活中的人机交互和智能家居。
其他文献
计算关联成像作为一种新型的成像方式,具有传统成像不具备的抗干扰性强的特点,近年来在水下成像、遥感成像中发挥着其独特的作用。在散射介质下的计算关联成像中,如水下计算关联成像,测量矩阵对成像效率和成像结果的质量都至关重要。本文围绕存在散射介质的不同测量矩阵计算关联成像进行了研究,主要工作内容如下:1.通过比较散射介质中计算关联成像应用的不同的测量矩阵,研究了应用不同测量矩阵的成像速度和成像质量。通过选
三维点云配准是寻找两个或多个三维点云之间的最优空间变换关系,使其能够在空间中达到良好的匹配,它是计算机视觉、模式识别和智能机器人等领域的关键技术之一,具有重要的理论研究意义和实际应用价值。三维点云配准主要分为刚体配准和非刚体配准两大类,对于包含噪声、外点及数据缺失的点云非刚体配准算法研究仍是当前点云配准领域的一个热点和难点问题。针对包含噪声、外点及数据缺失的三维点云非刚体配准,本文在深入研究传统迭
视频超分辨率重建是一种根据低分辨率视频恢复高分辨率视频的技术。视频超分辨率技术是计算机视觉领域中的经典和热点研究内容之一。视频超分辨率重建旨在利用视频帧序列的时空相关性生成精度高,且感知质量好的高分辨率视频。本论文重点围绕基于深度学习方法提高视频的感知质量问题展开研究。在深入研究先进的基于深度学习的视频超分辨率方法的基础上,提出了一个新的光流补偿结合多特征鉴别生成对抗网络OFC-MFGAN,并将其
近年来,深度卷积神经网络(Deep Convolution Neural Networks,DCNN)在单幅图像超分辨率(Single Image Super-Resolution,SISR)中得到了广泛的应用。然而,大多数现有的基于DCNN的SISR方法往往会产生过于平滑的输出,对图像细节信息的恢复不够理想。为了解决上述问题,本文对基于小波变换和自注意力机制的图像超分辨率重建算法进行了相关研究,
在网络媒体时代,人们通过微博、短视频等社交平台对各类热点事件发表相关言论和看法,这些文本内容简短、表达幽默,能充分反映人们的内心情绪。挖掘这些短文本的潜在情感倾向性,分析和预测用户行为,可以为各个领域的舆情监管工作提供辅助支持。目前,面向网络短文本的情感分析算法研究已取得了一定的成果,但仍存在一些问题,例如,网络新词的不断涌现造成分词效果较差;短文本表现形式的复杂导致传统特征选择结果不佳;特征学习
MOOC平台课程评论文本中包含了大量学习者对某一门课程的看法,甚至是对授课教师和学习平台的看法。然而海量的评论数据使得教师或平台无法对每条评论及时阅读和处理。通过对MOOC课程评论进行情感分类和方面挖掘研究,能够了解学习者在学习过程中所关注的方面和对其产生的情感态度,有助于教师或平台改进教学方式和完善平台功能,从而调动学习者积极性,降低退课率。本文以MOOC课程评论文本为研究对象,针对情感分类和方
句子相似度计算是自然语言处理中广泛应用的技术,是句子语义理解的基础,能促进计算机对人类语言的深入理解。为了能准确地对句子进行相似度计算,本文首先提出一种能准确地对句子语义建模的句子表示方法,然后提出一种能高效地对句子之间的语义关系建模的句子匹配算法,最后在此基础上提出一种句子相似度计算方法。本文主要研究工作如下:(1)针对句子包含的空间信息的特征很难被准确提取的问题,提出了一种基于异构图的句子表示
眼眶淋巴瘤(Orbital Adnexal Lymphoma,OAL)和炎性假瘤(Idiopathic Orbital Inflammation,IOI)是眼眶最常见的两种淋巴组织增生性疾病。OAL是一种恶性眼眶肿瘤,发生率高达55%,其最佳治疗方法是局部放疗。IOI是一种特发性良性病变,约占眼眶疾病的10%,糖皮质激素治疗是目前公认首选的治疗方法。这两种疾病治疗方法的巨大不同使得区分二者极为迫切
古代文物具有丰富的文化内涵,由于自然灾害或人为因素,出土文物存在不同程度的缺损,影响了虚拟展示等后续工作。随着三维激光扫描技术的发展,三维数字化修复成为文物虚拟化修复领域的挑战性问题,对重现文物全貌具有重要意义。然而,为了提高修复效率首先会压缩文物模型,导致部分特征丢失。此外,复原的三维文物表面缺乏颜色纹理的信息。因此本文应用深度学习技术,分别从三维和二维的角度修复表面几何特征和纹理信息。主要研究
随着计算机视觉技术的蓬勃发展,人们越来越不满足于仅通过计算机了解场景目标的二维信息,使用二维序列图像重建出目标主体的三维信息成为了越来越迫切的需求。如今,基于序列图像的三维重建技术已在多个领域发挥着不可替代的作用,然而该技术存在着无法兼顾重建精度与实时性的问题。本文主要关注序列图像三维重建的精度与实时性问题,从三维重建对输入序列图像的分辨率要求较高以及传统三维重建算法无法兼顾精度和实时性这两个问题