论文部分内容阅读
本文主要从听觉感知和声学分析的角度对法庭案件语音中经常出现的九种伪装发音类型进行了深入细致的研究。通过与正常语音的比较分析,对各种伪装语音的发音特点、声学表现形式、声学参量的变化及其对话者识别造成的影响以及声学参量回归模型的建立等情况进行了归纳和总结,并指出了实际伪装语音检验鉴定中应该注意的问题。本文的研究结果对于法庭话者辨认技术的实际应用具有重要的意义,对于语音自动识别和话者自动识别也有一定的参考价值。
本文共分为十章,内容安排如下。前三章主要交代研究的背景,第一章为绪论,介绍了什么是司法语音学、司法语音学与语音学的关系、司法语音学研究的主要内容及其在中国的发展历程,重点介绍了法庭话者辨认技术及其理论基础。第二章对伪装语音进行了总体概述。介绍了伪装语音的定义、分类、常见的伪装语音类型、国内外关于伪装语音的研究结果。第三章介绍了本文研究的出发点、研究的主要内容和方法。第四章至第九章是本文的主体部分,第四章研究的是一位发音人和他的九种伪装语音,对他的正常语音和伪装语音进行横向比较分析,通过语音改变的程度来考察伪装发音时个人发音习惯改变的适应性和发音器官的调制能力。第五章对所有发音人的正常语音进行声学分析,明确了正常语音声学参数的总体分布水平以便与伪装语音的参数水平进行对照研究。第六章至第九章分别对改变基频伪装语音、变速伪装语音、四种通过外在干预发音器官形状形成的伪装语音和耳语伪装语音进行了研究。通过声学调查和统计分析,并与正常语音的参数水平进行比较,总结了各类伪装语音的声学特征、与正常语音的差异、参数的稳定性和抗畸变能力、伪装发音的参数改变对话者识别率的影响以及实际伪装语音检验鉴定中应该注意的问题等等。第十章是结论,总结全文,并指出下一步的研究方向。
本文的研究结果表明:第一,伪装语音在很大程度上使发音人的语音产生变异,这不仅可以通过听觉感知到,也表现在声学参量的改变上。然而,语音的伪装具有局限性,一方面受发音器官生理结构和调制能力的限制,个人语音的变化幅度有限;另一方面,语音伪装缺乏稳定性和持久性,发音习惯的“根深蒂固”使发音人很难自始至终都保持完全的伪装模式发音。当然,这和发音人的伪装技巧以及发音器官的调制能力有关。第二,听觉感知的结果和声学表现不是完全对应的,有些语音的感知结果还没有发现对应的声学相关物。第三,伪装语音的声学参数改变呈不均衡状态。发音方式不同,各个参数变化的趋势和幅度也不相同,有些参数比较敏感,变化显著,有些参数则相当稳定。利用回归模型可以在一定程度上实现伪装语音的参数补偿和逆推。第四,就同一种伪装发音而言,不同发音人参数变化的趋势和幅度也不相同,具有很强的特异性,话者之间差异较大,这有利于话者识别。总之,从语音检验的角度来说,尽管伪装发音使语音特征有了很大程度的改变和扭曲,但是还是可以利用伪装语音进行话者识别的,检验识别的效果取决于伪装水平的高低和声音扭曲的程度。