汉语耳语音转换为正常音的研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:taicangliliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
耳语音转换为正常音,在可应用于公众场合下的通讯、失音者的语音恢复和公安司法工作的某些特殊需要等方面。它是一个全新的课题,有许多问题亟待解决。 本文介绍了耳语音的生理、声学和感知特点,指出耳语发音与正常发音生理的差异导致了它们声学特性的差异,其中最主要的就是耳语音是噪声激励源和耳语音共振峰偏移。要将耳语音转换为正常音,就应修正这些差异。 本文设计了一个基于混合激励线性预测(MELP)模型的耳语音转换系统,它具有传输码率低、抗干扰强、音质效果好、易于参数修改的优点。对于汉语耳语音转换为正常音,主要是通过修改其激励参量和声道传输函数参量来实现。根据汉语声韵调的语言特性,本文主要做了以下几方面的工作: 耳语发音声门上区收缩和声门半开使得耳语音的共振峰发生偏移。本文提出了改进的动态规划共振峰轨迹自动跟踪算法,通过对汉语耳语音和正常音的共振峰进行统计分析,得出了偏移比例,以及耳语音共振峰与汉语声调的关系。此项研究填补了汉语耳语音声学特性研究方面的空白。另外,提出了基于线谱对进行共振峰估计及修改的方法,根据统计出的偏移比例,实现共振峰频率的快速修改。 由于对于汉语耳语音只需在韵母段添加基频,所以汉语耳语音必须进行声韵分割。本文提出了基于信息熵的耳语音端点检测方法,以及相对熵、音长和谱重心相结合的汉语耳语音声韵分割法。该算法鲁棒性强,准确率高于频域法、聚类法、谱平坦度法和听觉模型声韵分割法,可用于耳语音的识别与转换的预处理。 汉语的基频值与声调密切相关,需根据声调模型添加基频,因此必须进行汉语耳语音的声调识别。本文讨论了表征耳语音声调的各特征参数,提出了响度加权的32个Mel频段的对数幅值包络加音长的特征量,基于此参数对汉语孤立耳语音进行声调识别实验,其声调识别率已达到了人耳的平均辨听率,它为连续耳语音的声调识别研究打下了基础。 此外,本文为解决转换音的低频衰减、声级低、语速慢的问题,还提出后处理方法,仞步完成了基于MELP模型的汉语耳语音到正常音的转换系统。本系统恢复出的正常音,音质虽不及正常发音产生的语音自然,但是人们能正确听辨,并能听辨出发音者的一些发音特征。因此,它具有携带发音人的发音特性、音质较好、便于应用的优点。 论文的最后,简要地介绍了论文作者攻读博士期间的相关工作——混响声场中的语音识别。提出了抗混响的滤波规整的MFCC特征参数,它可以提高室内声控拨号系统的识别率。
其他文献
GaAs基QWIP由于具有优异的材料均匀性、灵活的能带剪裁以及成熟的生长制备工艺等优势在红外探测领域具有广泛的应用前景,但传统的GaAs/AlGaAs材料体系由于能带结构的限制,响应
2007年,DelHaye等人报道了世界上第一个微腔光频梳,自此之后,微腔光频梳先后在多种材料平台上被实现,并且被成功地应用到超高速并行光通信技术、微波光子学、光学频率合成、光钟
在大力推进课改的今天,我认为课改的主要任务应该是对课程资源的整合与利用。数学课程资源是指依据数学课程标准所开发的各种教学材料以及数学课程可以利用的各种教学资源的总和。在课程改革中,课程资源的整合和利用越来越受到人们的重视。作为课程资源的开发者和利用者,教师应因地制宜,有意识、有目的的整合和利用好各种资源。让这些资源更好地服务于教育教学工作,这样既有利于学生的全面发展,也有利于教师的全面发展。  一
多层介质膜是激光系统中非常重要而又最易损伤的基本元件。长期以来,激光对光学薄膜元件的破坏一直是限制激光向高功率、高能量方向发展的瓶颈,也是影响高功率激光薄膜元件使用
本文主要简述了以下几方面内容:   (1)利用透射电子显微术研究了(001) LaAlO3单晶基片上采用脉冲激光沉积技术外延生长的Ba0.5Sr0.5TiO3薄膜。这种薄膜室温处于顺电相,低温
本文从量子色动力学的手征对称性出发,介绍了关于量子色动力学低能区的有效理论Extended Nambu-Jona-Lasinio模型(ENJL模型),分析了ENJL模型与手征微扰论的关系,并得到了标量介
照度是单位时间单位面元所接收的辐射能量。照度计是测量照度的仪器。在光度学中照度称为光照度(1ux),而在辐射度学中照度称为辐照度(wm-2),因此照度计也有光照度计与辐照度计
学位
本文从大块金属玻璃的弹性常数与组元的弹性常数之间的关系出发,根据弹性常数与形成大块金属玻璃的结构、热力学和动力学影响因素的关联,借助已有的经验准则和判据,设计出具有好
本文研究了飞秒激光诱导的等离子体及其对脉冲传输的影响。具体内容如下: 首先,利用数值求解光脉冲非线性传输方程的方法,我们研究了一个峰值功率低于自聚焦临界功率的飞秒脉
在阅读教学的过程中,教师应具有强烈的发掘学生生成信息源价值的意识,珍视学生独特的感受、体验和理解,将其看作重要的教学资源,关注思维训练,关注言语规律,关注表达运用,培