【摘 要】
:
世界上有数以万计的聋哑人,如果手语能够通过识别技术转化为语音,将极大地促进聋哑人与正常人之间的交流。为了实现手语领域的人机交互,需要设计出一个可以识别多个身体部位的动作系统。本文研究了基于Wi-Fi信道状态信息(Channel State Information,CSI)的手语识别问题,利用商业Wi-Fi设备实现了一个名为WiSign的原型,实现了单词级别和句子级别的手语识别,并在真实的室内环境中
论文部分内容阅读
世界上有数以万计的聋哑人,如果手语能够通过识别技术转化为语音,将极大地促进聋哑人与正常人之间的交流。为了实现手语领域的人机交互,需要设计出一个可以识别多个身体部位的动作系统。本文研究了基于Wi-Fi信道状态信息(Channel State Information,CSI)的手语识别问题,利用商业Wi-Fi设备实现了一个名为WiSign的原型,实现了单词级别和句子级别的手语识别,并在真实的室内环境中评估了它的性能。结果表明,WiSign在识别包含头、臂、手和手指的手语句子时达到了令人满意的准确率。本文的研究内容与贡献包括以下三个方面:1.在单词级别手语识别部分,提出了一种基于功率谱密度(Power Spectral Density,PSD)的手语词分割方法,用于捕获不连续手语词之间的过渡停顿,并将手语句分割成孤立的手语词。本文发现了同一动作高能量谱值波形相似的特点,提出了利用互相关函数来减少在时域分割中,由于“过渡手势”引起的误差的方法。将深度信念网络(Deep Belief Network,DBN)和基于高斯混合分布的隐马尔科夫模型(Hidden Markov Model,HMM)相结合。这是一种对时间和空间信息进行特征提取和分类的方法。该混合模型在不同的操作环境下,在多个层次上提取有效的特征,避免了人工经验选择的不合适的特征。2.在句子级别的手语识别部分,提出使用CCA-HAN框架,绕过时域分割,从而不需要对“过渡手势”进行去除。通过采用注意力模型,自动提取关键性的手语动作特征,并且缩小手语单词的one-hot向量与CSI数据的语义差距,提升了手语识别准确度。3.本文用商业WiFi设备实现了一个WiSign的原型,并在真实的室内环境中评估了它的性能。实验结果表明,在不同的环境下,在单词级别手语识别部分(或在句子级别手语识别部分),一人的个性化模型的准确率高达92%和87%(或95%和87%),三十人的通用模型的准确率为69%(或65%)。
其他文献
设施管理(Facilities Management)能够为建筑提供高品质的环境并提高投资效益。其管理范围包括资产管理、安全管理、设施设备管理等是项目全生命周期运营维护阶段的重要管理方法。传统的设施管理模式因为对信息保存难度大容易产生信息孤岛的问题,难以发挥应有的作用。随着近年来建筑信息模型(Building Information Modeling)在国内建筑行业的应用有了很大的发展,有人提出将
在产品创新设计研发过程中,用户需求研究是最基础也是最核心的一部分。用户需求产生于人的欲望,由欲望引发用户动机,并体现于用户与产品或系统的交互——用户体验的过程中。用户体验是动态的过程,随着用户、场景与产品状态的改变,相应的用户对产品的需求也会发生变化。因此,用户需求识别/挖掘研究与用户体验的过程密不可分。在发达的互联网环境下,在线用户评论数据内容丰富,且蕴含着大量用户信息,是获取用户需求的重要数据
AR(Augmented Reality)技术,即增强现实技术,是一种基于真实环境实现虚拟信息叠加的数字技术。随着新媒体与数字时代的到来,纵观国际大环境,AR技术已凭借着虚实结合与实时交互优势逐渐在建筑遗产展示领域得到诸多探索与应用实践,我们也有必要在系统学习、分析借鉴这些实践经验的基础上,针对中国建筑遗产的特点与价值,探索AR技术可以为中国建筑遗产带来的展示方式。此次研究是一次新思维与数字技术视
药物研发耗时费力成本高昂,药物重利用是解决问题的重要途径,其中药物-疾病的关系预测是药物重利用中的研究热点。早期的方法主要是基于文本挖掘的关系链接预测的相关方法,但是无法考虑疾病的潜在机制。为了更好地处理和分析疾病机制中的复杂关系,网络模型被应用到药物-疾病相互作用关系预测研究上。现有的基于网络模型的关系预测方法虽然考虑了复杂关系的整体性,但却忽略网络中的节点差异性。另一方面,现有模型大都采用是以
随着当前互联网环境中各类社交媒体的快速发展,人们在互联网上留下了海量的电子足迹信息,这些信息包含了人们的社会言论、社会关系、社会行为等丰富数据。这些数据为我们构建用户画像,分析社会关系提供了重要的数据支持。社会关系是人类社会的重要组成部分,社会关系分析是社会网络研究的重要基础。传统的社会关系分析研究多倾向于关系的方向、强度和类型,缺乏丰富的语义内涵,因此这些方法所构建的关系画像存在局限性,难以支撑
在信息检索中,最近的研究表明,信息检索系统的平均有效性的提高可能会降低信息检索系统在多个主题的得分的稳定性,这个现象表明有效性和稳定性两者之间存在一个折中。另外,一些风险指标被提出来度量系统的风险,但是这些评价指标是与前面所提到的有效性评价指标是分开定义的。综上所述,目前信息检索评价领域主要存在三个问题:(1)系统的有效性和稳定性尚未在一个统一的框架中进行系统的评估;(2)在这个框架下,这个统一的
目前关于人脸面部表情的研究主要是对静态人脸图片直接分析识别,这种方法往往在实验室环境下的人脸数据集上表现不错,却难以适用于含有有损人脸的野外复杂环境下的人脸数据集,比如低分和有部分遮挡等人脸图片。本文旨在通过人脸修复模型对有损人脸进行修复生成,然后利用人脸面部表情识别模型对修复后的人脸进行面部表情动作单元识别分析。本文主要解决的问题是保证修复生成后的人脸图片的人脸面部表情动作与真实的人脸面部表情动
校园暴力和欺凌已经成为严重影响青少年健康成长的问题之一。目前的预防措施主要依靠个人主动揭发或者学校监督。到目前为止,还没有一个有效的解决方案能够自动检测出暴力欺凌事件。检测暴力欺凌事件的本质就是人体行为识别。目前,人体行为识别在教育、医疗、商业和军事领域已经有广泛的应用。而且,人体行为识别在计算机视觉、可穿戴传感器和基于环境传感器技术方面都有一定的研究。但是,这些技术都有一些设备,场景的限制,无法
三维钻孔可视化是钻孔设计中的重要方面,旨在更形象的展示钻孔的内部结构,方便用户的设计,具有一定的现实意义。本文对三维空间展示相关理论进行了研究,并对系统需求与系统的主要开发技术进行了深入的分析。确定以MVC开发模式为基础,采用Beego框架以及Mongo DB数据库,结合HTML5、Web GL和Java Script等前端可视化技术实现系统功能设计与界面设计。系统划分为计划钻孔展示、实际钻孔展示
知识图谱在描述现实世界中的各种实体和关系方面具有良好的表现形式,它是人工智能领域的一项关键技术,研究热度随着人工智能的发展而不断提高。作为描述大规模知识图谱的标准数据格式资源描述框架RDF,伴随着知识图谱的兴起,也广泛应用在各个领域,与我们生活息息相关。例如,用于帮助搜索引擎找到更符合用户需求的答案、用于优化对一个事物的具体描述。RDF数据的广泛使用导致其数据日益庞大,亟需一个高效的数据管理系统进