基于语音识别的虚拟人手语翻译研究

来源 :天津理工大学 | 被引量 : 0次 | 上传用户:fairylky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我国聋哑人群数量庞大,亟需接受各类教育的学生数量与日俱增。因此,语音识别虚拟人手语翻译,对提升聋哑人社会融入度,改善聋哑学生高等教育教学环境,提升聋哑学生人才培养质量具有重要的意义。本文对语音到手语的专项翻译进行了研究,提出了一种语音到手语编码的虚拟人手语翻译方法。针对目前语音手语翻译多分步操作易产生误差积累,手语输出易受文本分词效果影响的问题,本文提出了由语音到手语编码的一步式翻译方法。该方法在语音识别中直接输出手语编码,由编码进行手语输出,摒弃了逐步翻译的模式,并摆脱了分词对手语输出的影响。为实现语音到手语编码的一步式翻译模式,本文提出了基于ECA-CNN-CTC的声学模型和基于自注意力机制的手语编码语言模型,由二者结合共同完成了语音到手语编码的识别任务。针对基于卷积神经网络的模型受限于卷积窗口大小而无法获取足够多上下文信息的问题,提出了基于注意力机制的卷积神经网络模型(ECA-CNN)。采用ECA注意力机制模块来压缩全局通道特征,使卷积近似的获得全局感受野,提取足够的上下文信息。在此基础上,结合CTC构建了基于ECACNN-CTC的声学模型,实现了语音到拼音序列的映射。同时,为满足拼音到手语编码的映射需求,本文利用自注意力机制结构搭建了拼音到手语编码的语言模型。在手语输出中,传统的以图片合成或视频合成输出手语的方式缺乏直观现实性、不易修改、过渡不连贯;以虚拟现实技术实现手语输出的方式多用字、词作为手语动画制作的基点,手语动画重用率低,难以完成大规模的手语动画库。所以,针对以上问题,本文提出了基动作合成的虚拟人手语输出方式。以虚拟人手语基动作为制作基点构建手语动画库,在上述语音识别方法输出手语编码后,手语编码调用各个基动作组成完整手语,完成输出。该手语输出方式更加直观、连贯和生动,同时手语动画重用率高,减轻了手语动画制作的压力。总的来说,本文提出的虚拟人手语翻译方法便捷有效、便于使用,无需借助其他外接设备,是一个实用性极强的手语翻译方法。
其他文献
学位
在老龄化背景下,老旧小区加装电梯成为解决老年人出行以及提高老旧小区居民幸福感的重要途径。近年来,天津市人口老龄化的比例在不断增大,在老旧小区加装电梯的需求在逐渐增多。在实践中,政府、加梯企业与居民之间存在矛盾冲突,各方诉求难以有效协调,阻碍了加梯工作推进。为有效解决不同利益相关者之间的矛盾,分析不同主体的诉求,促使项目实施过程中关键主体的诉求可以得到满足,推进老旧小区加装电梯项目的实施。结合利益相
富锂锰基材料具有高容量,是有前景的锂离子电池正极材料。常规的O3型正极材料在循环过程中易发生层状相向尖晶石相的结构转变,导致电化学性能的衰减。O2型富锂锰基材料内部氧原子以ABBA模式堆叠,能有效抑制循环过程中材料的结构转变。但在高电压区,O2型富锂锰基材料表面易与电解液发生副反应的缺点,阻碍了其实际应用。基于此,本论文以O2型富锂锰基材料Li[Li0.25Ni0.1Co0.05Mn0.6]O2(
学位
学位
学位
随着无线体域网和可穿戴电子设备的快速发展,可穿戴电子设备在娱乐休闲、定位追踪、健康管理、运动监测、医疗辅助和军事领域得到了广泛应用。可穿戴天线传感器因其无线传输、尺寸小、低成本等优点而受到研究者的极大兴趣。在穿戴式天线中加入超材料结构可以隔离天线和人体的相互影响,不仅能减少天线对人体的辐射,还能增加天线的正向辐射,使天线的性能更加稳定。论文中的工作主要如下:(1)设计一款加载3×3的电磁带隙(EB
螺旋锥齿轮具有传动效率高、寿命长、噪音小等优点,主要应用于航空航天、航海、汽车等行业的关键零部件。当前我国向“中国智造”全面转型的重大战略对螺旋锥齿轮的加工精度提出了更高的要求,所以在传统磨削加工的基础上引入超声振动来加工螺旋锥齿轮。超声振动的引入,改变了磨粒的运动轨迹和螺旋锥齿轮齿面的成形机理,同时能够降低磨削力。而磨削力与砂轮耐用度、磨削表面粗糙度等均有直接关系,故作为磨削结果的评定参数,可评
本文是一篇以中美关系为主题的演讲的口译模拟实践报告。笔者选取了曾任中国人民解放军少将、国防大学战略研究所所长、战略学博士生导师金一南教授的演讲作为源语材料。其演讲主题为“中美战略博弈与关系走向”,其中固然不乏政治类词汇,但因金教授的个人演讲风格偏向于口语化、通俗化,这在一定程度上降低了笔者的口译难度,与之相对的,也带来了一些困难。在此次口译模拟实践中,笔者发现了自身在口译中遇到的困难和问题,并对其
学位