论文部分内容阅读
为了帮助聋人更好地融入正常人的社会,改变他们的弱势地位,越来越多的研究人员参与到手语的研究领域中。近年来,一种通过合成虚拟人手语动画的方法被提出来,便于聋人通过观看手语动画理解和接收信息。而要合成更具真实感和可懂度的手语动画,实现手语表达中的韵律信息是必要的。同语音中的韵律信息在语言表达中起的作用一样,手语中的韵律能够提高手势的表达能力,提供额外的辅助理解的功能。在合成手语时,除了提供必须的用于表达语义的文本信息外,还需要得到手语表达所需的韵律信息。本文从语音中的韵律信息入手,考虑使用语音表达中的丰富韵律信息,将其映射转换至手语韵律参数,从而得到具有韵律信息的手语动画。在本文中,为了提取出语音中的韵律信息,针对汉语中韵律表达的特点,选取了基本声学参数中的音节时长,音强和音高参数。音节的时长通过采用基于汉语元音的端点检测方法,划分出各个音节的边界;音强则在此基础上用其短时能量来表示;对于音高的计算,则通过使用倒谱法估计出其基音频率得到。本文利用这几个基本的声学参数,构造出了一个用于识别强调韵律的特征向量,并使用其训练不同韵律模式的隐马尔科夫模型(HMM)。为了提高训练出的模型的鲁棒性,考虑人耳感知强调韵律的特性,采用了一系列相对值用于构成该向量。通过HMM识别出的韵律模式和得到的相关参数,将其映射转换到手语表达的韵律参数,就能直接用于合成中国手语动画。从语音韵律到手语韵律的映射,采用了中国手语标记语言(CSLML)对其进行描述。最后本文在机顶盒平台上实现了一个伴随电视节目播放而同时播放中国手语动画的系统,能够有效地帮助聋人观看电视节目,接收社会信息。