语音文本驱动的中国手语动画合成

来源 :北京工业大学 | 被引量 : 1次 | 上传用户:a348329418
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了帮助聋人更好地融入正常人的社会,改变他们的弱势地位,越来越多的研究人员参与到手语的研究领域中。近年来,一种通过合成虚拟人手语动画的方法被提出来,便于聋人通过观看手语动画理解和接收信息。而要合成更具真实感和可懂度的手语动画,实现手语表达中的韵律信息是必要的。同语音中的韵律信息在语言表达中起的作用一样,手语中的韵律能够提高手势的表达能力,提供额外的辅助理解的功能。在合成手语时,除了提供必须的用于表达语义的文本信息外,还需要得到手语表达所需的韵律信息。本文从语音中的韵律信息入手,考虑使用语音表达中的丰富韵律信息,将其映射转换至手语韵律参数,从而得到具有韵律信息的手语动画。在本文中,为了提取出语音中的韵律信息,针对汉语中韵律表达的特点,选取了基本声学参数中的音节时长,音强和音高参数。音节的时长通过采用基于汉语元音的端点检测方法,划分出各个音节的边界;音强则在此基础上用其短时能量来表示;对于音高的计算,则通过使用倒谱法估计出其基音频率得到。本文利用这几个基本的声学参数,构造出了一个用于识别强调韵律的特征向量,并使用其训练不同韵律模式的隐马尔科夫模型(HMM)。为了提高训练出的模型的鲁棒性,考虑人耳感知强调韵律的特性,采用了一系列相对值用于构成该向量。通过HMM识别出的韵律模式和得到的相关参数,将其映射转换到手语表达的韵律参数,就能直接用于合成中国手语动画。从语音韵律到手语韵律的映射,采用了中国手语标记语言(CSLML)对其进行描述。最后本文在机顶盒平台上实现了一个伴随电视节目播放而同时播放中国手语动画的系统,能够有效地帮助聋人观看电视节目,接收社会信息。
其他文献
随着我国市场经济和信息技术的不断发展,企业对科学化财务管理的需求越来越强烈,财务管理系统作为企业财务管理信息化系统的软件平台,对提高企业财务部门工作效率、提高企业
近年来,随着Web应用和HTML5的普及,Web安全问题也日益突出。OWASP公布的2013年十大Web应用安全风险中,跨站脚本漏洞XSS(Cross Site Scripting)名列第三,已成为当前各类Web应
随着科技水平的不断发展,人们对计算能力的要求也随之增高,因此,片上多核处理器已经成为主流处理器发展的趋势。伴随着片上多核处理器集成的核数越来越多,DRAM内存系统承受的
随着信息技术与生物技术的飞速发展,人脸识别技术在各领域的应用越来越广泛。本文以Olivetti Research Laboratory(ORL)人脸库和Yale人脸库为研究对象,对人脸识别技术中的特
该文对经典关联规则的开采算法进行了较全面和深入的研究,并基于国产数据库管理系统DM2设计和部分实现了一个集成的关联规则开采系统原型。主要研究内容如下:该文首先研究了经