区分性训练在计算机辅助发音训练系统中的应用

来源 :南开大学 | 被引量 : 0次 | 上传用户:tenghua303
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着全球化和经济的快速发展,英语的口语学习日益重要。作为指导人们的英语口语学习的计算机辅助发音系统(CAPT)在研究如何有效地进行发音评价,具有实际意义和应用价值。系统的声学建模是基于HMM声学模型的最大似然估计(MLE)准则训练后所得模型。MLE准则训练时,未对易混淆的模型进行区分性处理,模型之间的区分程度不高,从而很难获得准确的评判信息,要想获得更好的纠错性能就要对模型做进一步的改进。本文在原有MLE准则并自适应训练的基础上加入区分性训练方法,以期可以取得较好的纠错性能。   系统纠错性能依赖于经过准确训练参数的HMM模型。以往来看,曾经占主导地位的训练算法是MLE准则,该准则由于其训练速度快,占用资源少等优点得到了普遍的应用。MLE准则建立在以下几个假设的基础上:观察序列从已知分布中获得;训练数据集是无限的,并且已知实际的语言模型。然而实际上,在语音识别上这几个假设都是不成立的。   为改进训练参数,区分性训练制订一个目标函数来试图优化了模型的正确性,以某种方式惩罚那些容易混淆正确和不正确的结果的参数集。基于信息论的角度的最大交互信息准则(MMIE)考虑了不同词之间的相互影响,从而保证系统评判的性能。   本文主要做了以下工作:在HMM模型自适应之后加入声学模型区分性训练,对MLE训练算法和基于区分性训练准则的MMIE训练算法以及最小音素错误训练(MPE)算法进行研究,实现了各训练算法并应用在CAPT系统中从而进行结果对比。结果表明,MMIE区分性训练方法的模型精度和识别率有较大的提高。在系统的在判错性能上,MMIE区分性训练准则算法的系统误识率比改进前算法降低了百分之三点一。
其他文献
随着科技的进步和经济的发展,计算机和计算机网络在人们的工作和生活中日趋普及。同时社会上的各个领域对计算机的依赖越来越强,随之而来的信息安全问题显得日益重要。计算机知
超宽带通信作为可实现高达1Gbps的高速无线数据传输技术近年来正受到广泛的关注,并且在各方面都取得了广泛的应用,包括无线多媒体、无线网接入和新一代移动通信系统等等。在脉
近年来随着人们对微观世界认识的加深,纳米科技得到迅猛发展,而原子力显微镜(Atomic Force Microscopy, AFM)作为纳米测量和操作的主要工具之一,在纳米科技领域有着举足轻重的地
在确定模型和噪声边界的情况下,Fogel和Huang提出了基于最优外定界椭球的集员估计方法,成为了集员估计理论的一个重要分支。通常情况下,运用各种方法所得到的系统模型仅能尽
分布式风电(Distributed Wind Generation,DWG)作为一种清洁、环保的绿色能源,具有改善生态环境,优化能源布局,促进经济和社会健康发展的优势,但是DWG功率的随机变动加重了电网的负
近年来,伴随着我国的经济持续而快速的发展和人们生活水平的日渐提高,购买能力迅速膨胀,以至于汽车市场的消费出现爆发式的增长,汽车逐渐进入各家各户。然而,随着汽车电子技术的提
最优化概念反应了人类实践活动中普遍的现象,即要在其它各个方面允许的前提下,争取在可能范围内的获得最佳效果。因此,最优化问题成为了现代数学的一个重要课题,并且涉及多种不同
在我们的生活中,各个行业的发展都离不开运输业的协作,而运输装备的发展关系着整个运输业的前景。随着生活水平的提高,人们对运输装备有了更高的要求,其中运输装备的安全性是
传统的抄表系统存在布线难、实时性差、准确率低、传输效果不理想等问题,浪费人力、物力,给抄表人员带来了很大的麻烦,为了解决这个问题提出远程、集中、实时抄送系统的新课题。
目前我国大部分温室安装的仍是普通的水表,因此需要人工进温室抄表,这种方式需要的工作人员多,不但费时、费力,而且效率低,容易出现迟缴、拖缴、漏缴等问题。另外一个农户可能会有多个温室,如果每个温室安装一个水表,又对每个水表配一张水卡进行售水管理的话,用户就得有多张水卡,这样用户使用水卡时就比较繁琐,容易拿错或者丢失。因此在参考国内外相关产品的基础上,结合实际的工程项目,提出了一套售水管理系统的解决方案