论文部分内容阅读
随着全球化和经济的快速发展,英语的口语学习日益重要。作为指导人们的英语口语学习的计算机辅助发音系统(CAPT)在研究如何有效地进行发音评价,具有实际意义和应用价值。系统的声学建模是基于HMM声学模型的最大似然估计(MLE)准则训练后所得模型。MLE准则训练时,未对易混淆的模型进行区分性处理,模型之间的区分程度不高,从而很难获得准确的评判信息,要想获得更好的纠错性能就要对模型做进一步的改进。本文在原有MLE准则并自适应训练的基础上加入区分性训练方法,以期可以取得较好的纠错性能。
系统纠错性能依赖于经过准确训练参数的HMM模型。以往来看,曾经占主导地位的训练算法是MLE准则,该准则由于其训练速度快,占用资源少等优点得到了普遍的应用。MLE准则建立在以下几个假设的基础上:观察序列从已知分布中获得;训练数据集是无限的,并且已知实际的语言模型。然而实际上,在语音识别上这几个假设都是不成立的。
为改进训练参数,区分性训练制订一个目标函数来试图优化了模型的正确性,以某种方式惩罚那些容易混淆正确和不正确的结果的参数集。基于信息论的角度的最大交互信息准则(MMIE)考虑了不同词之间的相互影响,从而保证系统评判的性能。
本文主要做了以下工作:在HMM模型自适应之后加入声学模型区分性训练,对MLE训练算法和基于区分性训练准则的MMIE训练算法以及最小音素错误训练(MPE)算法进行研究,实现了各训练算法并应用在CAPT系统中从而进行结果对比。结果表明,MMIE区分性训练方法的模型精度和识别率有较大的提高。在系统的在判错性能上,MMIE区分性训练准则算法的系统误识率比改进前算法降低了百分之三点一。