融合手势与语音的多通道标绘交互技术研究

来源 :国防科学技术大学 | 被引量 : 0次 | 上传用户:jinhuikkkl
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体技术和虚拟现实技术的发展,人机环境中信息的输出形式更加丰富,同时也使用户所要面对的交互对象和交互内容变得更加复杂,传统的交互方式无法达到和谐、自然与人性化的交互要求。在军事应用领域,计算机辅助标绘是是一个典型需求,亟需研究其他交互方式来提高标绘交互自然性。本文融合手势与语音识别技术,对书空手势指令进行定义和识别,构建语音交互任务词汇的状态转移矩阵,采用任务制导的方式整合不同通道的交互信息,提出了基于任务槽结构的多通道整合模型,对交互任务和操作进行分析和设计,最后对交互任务进行综合实验。本文的主要工作和创新点有:一、提出了一种基于方向链码的书空手势识别算法,实现空间手势识别。采用Leap Motion进行自定义的手势识别和匹配,通过自定义手势指令,对其自身有限的手势识别指令进行扩充。为了消除手势输入过程中的不稳定性而导致的噪声干扰,对手势轨迹进行分段处理,由分段的比重确定主要移动方向描述输入手势,根据手势的相同分段对输入手势与模板手势通过顺序匹配算法进行匹配。二、在语音命令识别的基础上,提出了基于命令转移概率的语音任务组织方法,辅助语音命令识别和组织。根据语法规则和语义对交互任务语音词汇进行分类,剔除语音交互任务中任务动作的生僻词。通过场景语义上下文分析,确定当前场景中的交互对象及交互任务,采用马尔可夫状态转移概率矩阵分析词汇间的连接关系,排除异常输入的关键词,使系统能正确地理解用户的语音交互意图。三、提出了基于对象属性的多通道任务槽结构整合模型。对交互任务进行分析和设计,确定不同交互任务的任务槽的所需信息。用户与传感器进行元操作的交互,通过分层语义提取,将交互数据转换为能够被系统识别的任务所需的属性信息。根据属性类型的不同,将交互信息再填充到任务槽中相应的模块,构成系统可识别的交互语义,从而识别整个交互任务并交由计算机执行任务,实现系统的交互功能。
其他文献
三维地质模型可以为不同领域的工程设计、施工及决策提供帮助。以吉林某大理岩矿矿体为研究对象,采用3DMine软件对大理岩矿体进行三维地质建模、资源量估算和估算结果对比分
金融是现代经济的核心,金融的稳定与否,不仅仅涉及到金融业自身的生死存亡,而且还关系到经济、政治、社会的安全。从近几年国内外爆发的一系列金融危机中,人们逐渐认识到创建金融
设计了一种基于体感控制模块的新型遥控轮式机器人。利用信息检测模块(数字加速度传感器)测量体感控制模块姿态的数字信号,经由中央处理器模块(单片机)进行处理,将得到的倾角和倾
对含穿透型损伤层压板双面挖补胶接修补件的拉伸性能及主要影响参数进行了试验研究。结果表明:双面挖补后的失效拉伸强度恢复率能够达到80%;当挖补斜度1∶40、覆盖层取3层、
<正>文物的时寿受保护环境的影响,其中保存环境中甲醛的长期作用,能够使文物的原本形态和组分日益产生渐变,甲醛是当今防治文物微环境空气污染的一大热点。甲醛吸附有多种方
妇科推拿萌芽于魏晋南北朝,该时期已有妇科按摩手法、膏摩治疗妇科疾病的记载。隋唐时期为妇科推拿的发展阶段,妇科大力推广膏摩法,采用膏摩美容、手法结合其他疗法治疗妇科
随着各种信息技术的层出不穷,很大程度上推动了相关行业的建设发展。尤其是信息网络体系的建立更是有效地将资源进行了整合,如信息资源、人才资源、网络资源等。但信息化的不
工艺文件的发放和在制造现场的管理是许多制造企业要面对的问题,人工管理的模式存在工作量大、效率低、易出错等诸多弊端。文章研究分析了文件发放的流程,基于java的MVC框架
基于电信运营商的数据资源,并提出了网络操作大数据平台的数据的范围,定位系统体系结构和功能,结合4g网络推广,阐述了如何利用网络运营大数据平台的大规模数据资源,综合评价
为提高木材运输组织效率,在分析区域木材供需特点的基础上,建立了多周期区域木材运输优化模型,据此进行各周期的木材运输决策。每周期的运输方案受到供材点的供应量,需材点的