说话人识别中语音增强算法的研究和系统实现

来源 :重庆大学 | 被引量 : 0次 | 上传用户:sjtwwf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为一种基于生物特征信息的身份识别方法,说话人识别通过语音来识别说话人的身份,具有极大的应用价值和广泛的应用前景。说话人识别系统对纯净语音可以达到很高的识别率,但是在噪声环境下,系统的性能将会急剧下降。语音增强是解决该问题的主要方法,对带噪语音进行语音增强处理后,能使系统保持较高的识别率。因此,研究语音增强技术具有重要意义。语音增强一般作为说话人识别系统的预处理或者前端处理模块存在,其目的是从带噪语音信号中提取尽可能纯净的原始语音。由于噪声信号的来源复杂且特性各不相同,必须根据不同的噪声,采取特定的语音增强策略。本文主要针对加性宽带噪声,较深入地研究了基于短时谱估计的语音增强算法,对它们进行了探讨验证和改进,主要工作包括以下几个方面:①在端点检测方面,比较了几种常用能量特征的优劣。通过引入对数能量并调整阈值,对传统的基于短时能量和短时过零率的端点检测方法进行了改进,并通过实验验证了改进方法的有效性。②研究了基于短时谱估计的语音增强方法,包括谱减法、维纳滤波法和最小均方误差法。介绍了上述语音增强方法的基本原理、实现方法和改进算法。通过对以上方法的系统分析,总结出各方法的优缺点。详细分析了基于短时谱估计的语音增强方法的通用形式,并对以上方法进行了计算机仿真实验。③对传统的估计噪声功率谱的方法进行改进,在此基础上提出一种改进的基于先验信噪比估计的维纳滤波语音增强算法。从理论上进行了推导,并通过实验验证了该算法的有效性。④在深入探讨了语音增强算法的基础上,本论文将语音增强技术作为说话人确认系统的前端处理模块,设计并实现了抗噪声的说话人确认系统。
其他文献
随着我国科技水平的迅速提升,对于电力自动化技术来说也是一个非常难得的机遇.近年来我国电力系统取得了快速发展,电力电气自动化在电力工程中的应用也越来越多,这是电力系统
Vertical farming is the method of growing plants and crops over each other, mostly in buildings with many storeys. They often look like skyscrapers with glass a
期刊
随着机器视觉技术的发展,影像测量技术在工业零件的检测中得到广泛的应用。受精度要求的限制,影像系统只能对极小视场成像,当零件测量点较多时,两者需要做多次相对运动以获取
将压缩感知理论应用于遥感视频成像能很好解决遥感视频图像采样数据量大,带宽要求高同星上采样、存储资源有限之间的矛盾。论文以压缩感知遥感视频成像系统为研究对象,从压缩感知视频成像系统建模、重构模型和重构算法设计、稀疏表示字典设计三个方面对压缩感知理论在遥感视频成像系统中的应用进行了研究。在分布式信源编码理论的基础上,根据视频成像模型,建立了分布式视频压缩感知编解码模型和基于DCVS的解码算法,是视频重
随着半导体技术、微系统技术、现代网络和无线电通信技术的飞速发展,无线传感器网络被应用到越来越多的领域。而无线传感器网络要真正投入使用,不能完全孤立存在。如果通过WSN
本文通过对荣华二采区10
期刊