论文部分内容阅读
提出了一种用于听视觉语音识别的基于MASM的口形轮廓提取方法,这种方法只需要少量的训练数据就可以实现对大量口形轮廓的准确提取.还引入了一种口形轮廓的平滑修正方法,该方法利用口形连续变化的特点,对错误轮廓进行修正.实验证明,利用该方法提取轮廓的准确率比常规ASM模型高出20个百分点;将该口形轮廓特征引入到听视觉语音识别中,可以有效地提高噪音环境下的识别率.