汉语连续语流声调评测技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:aaxiongaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机技术和语音识别技术的发展进步,出现了计算机辅助语言学习(CALL,Computer Aided Language Learning)系统,利用CALL系统进行发音辅助学习,学习者可以即时获得有效的反馈。普通话评测属于语言学习的研究范畴,普通话水平测试电子化系统有助于高效地进行测试。 声调是区别方言与普通话的重要标尺,某种程度上决定了一个人普通话水平的基本面貌和基本水平。因此在普通话水平客观测试系统中,声调的客观评测是一个非常重要的子系统。对于连续语流,由于受上下文的影响,字调之间存在不可忽视的连续性,变调现象普遍存在且具有多样性,给声调识别器的结果带来严重的混淆,进而影响声调评测系统的实际性能。本文利用连续语流中韵律耦合效应和韵律信息紧密相关这一特性,着重在建模的经典方法基础上提出了利用上下文的声韵母和声调信息、当前音节所属韵律结构等韵律信息的建模策略,使得汉语普通话水平评测系统中连续语流声调评测子系统性能得到有效的提升。文章结构如下: 第一章简单介绍了语音评测的发展背景与现状,重点阐述了语音评测的原理、系统构成、以及所依靠的语音识别技术基础,最后引入声调评测的概念,并分析其中存在的难点。 第二章基于声调评测系统的三个基本模块:特征提取、训练模型和评测算法,分别详细描述了其经典方法和原理。重点对比介绍了基于核心段建模和基于上下文信息建模的传统建模方法,分析其中的存在的问题,并提出新的方法。 第三章首先简单介绍了韵律方面理论的发展。根据对韵律理论的研究分析得知:韵律信息和语流中基频变化密切相关:韵律信息提供的各种层次的间断将连续语流分割成更加便于理解和机器处理的小单元,因此本文提出以韵律词为基本建模单元,建立基于多空间概率分布的HMM调型模型(L1Tone-MSD),可以较好地解决基频的不连续性和连续语流中上下文信息严重影响基频变化给建模带来的困难。实验证明该子系统针对标准发音的声调识别率和针对方言背景的非标准发音的声调评测结果都有较好的提升。 第四章提出了基于多种韵律信息的上下文相关的复杂声调模型(CCDTM)。实验结果表明,上下文相关的复杂韵律声调模型比传统的上下文相关的三音子声调模型性能更稳定可靠。CCDTM有效地反应声调在不同语境下的变化形式,并为韵律评测的研究工作提供了基础。最后将对全文进行总结,并指出将来的可能的改进方法。
其他文献
通信环境的改变特别是在无线信道中人为噪声成为主要噪声源之后,如何利用人为噪声的相关性来提高信噪比,逐渐引起了人们的重视。反相对称法的基本原理正是利用带限噪声及其数
国内汽车产业的迅猛发展不仅带来了我国汽车保有量的快速攀升,也推高了国内对汽车零配件的需求。然而我国汽车工业在质量检测方面仍处于初级阶段,主观条件上的技术水平、技术
在无线通信中,采用基于多天线的阵列信号处理技术能使系统根据信号的来波方向调整方向图,减少干扰信号的影响,提高信干噪比。在现有的移动通信系统中应用阵列信号处理可以扩
合成孔径雷达是一种全天候、全天时现代高分辨力成像雷达,被广泛应用于地球遥感、海洋研究、资源勘探、灾情预报和军事侦察等领域。聚束式合成孔径雷达是实现高分辨力成像的
互联网的飞速发展已从根本上改变了人们的生活方式,使人与人之间的交流和沟通变得更加方便、快捷。但与此同时,网络的开放性又使得数据在传输过程中有可能遭受到各种攻击。因
雷达技术的迅速发展,促使雷达性能不断提高。如何根据需要选择适当波形是雷达系统设计的一项重要工作,因此雷达波形产生技术,属于雷达系统的关键技术之一。近年来波形产生技
期刊
一些灾难性事件如地震等会对建筑物的结构产生肉眼看不到的破坏,这些损伤严重威胁着人类的生命财产安全。通过对建筑物的振动情况实时监测,可以减少甚至避免不必要的损失。此外
人脸检测是确定人脸的位置、大小、数目的图像处理过程。人脸检测是人脸识别、人机交互、智能视觉监控等工作的前提。随着计算机应用的普及、性能提高以及图像和模式识别领域
伴随着互联网的高速发展,越来越多的人开始使用互联网进行网上通信。网络的便利与迅捷已经使人们把它当作生活中的一部分,而同时网络上也存在很多安全隐患,这就给一些别有用