噪声环境下的说话人识别研究

来源 :西北大学 | 被引量 : 0次 | 上传用户:jqh_0727
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别是语音信号处理的一项重要技术,是当前研究的热点之一。说话人识别是根据包含在语音中与说话人有关的信息来判定说话人的身份。本文从多个角度对说话人识别进行研究,实现了包括语音增强、特征提取、模型选择、产生识别结果在内的说话人识别系统。本文主要做了以下几个方面的研究:(1)分析STSA-MMSE算法实时性差的原因,通过引入参数(?)提高该算法的实时性,同时与听觉掩蔽效应相结合以减小语音的失真,提高语音的信噪比。通过Matlab仿真证明,改进后的算法在实时性和减小语音失真方面均好于原算法。(2)分析Mel频率倒谱系数各阶(MFCC)的特性,利用高阶参数对噪声的稳定性,对特征参数加正弦窗,提高特征参数的抗噪性。实验证明:加窗后特征参数的鲁棒性好于原特征参数。(3)研究矢量量化(VQ)理论在说话人识别中的应用,根据不同特征对识别率的贡献不同,在失真测度中对特征参数加权,以此提高系统的识别率。实验结果表明:本文给出的加权矢量量化算法在噪声环境下,性能优于原来的矢量量化算法。
其他文献
随着网站的维护和发展,尤其是网页的链接维护和删除,致使在网站服务器上产生越来越多的孤立文件(Isolated Web Files, IWF)。孤立文件存在于WEB服务目录中,具有完整有效的URL
随着现代工业技术的发展和制造水平的提高,商品生产和流通领域出现了越来越多的仿造品,严重危害了消费者的利益和正品厂商的信誉。因此,开展产品防伪技术的研究极为重要。一个好的产品防伪系统不仅能有效防止假冒伪劣产品的蔓延,还能为消费者提供方便。产品防伪系统应该具有安全性,只有做到安全保证,才能有效地保护正品产品的信息;产品防伪系统应该具有可用性,也就是说不能形同虚设;产品防伪系统应该具有便捷性,能够让消费
CAN总线以结构简单、可靠性高、抗干扰强、低成本、容错性好、传送数据帧短等优势而广泛应用于工业控制领域,但CAN总线协议采用非破坏性逐位仲裁规则分配总线使用权,使得网络
计算机网络的普及与发展使得信息系统的安全问题日益突出,相关的安全技术也成为人们研究的热点。访问控制是实现既定安全策略的系统安全技术,它根据安全策略的要求,对每一个
随着计算机软件技术及部队信息化的发展,武警部队需要一个能够充分利用内部各种资源的业务软件整合平台,用以提高内部业务软件安全性、保障业务连续性、加强IT管理、消除信息孤
面貌真实感三维人脸处理已成为计算机图形学领域研究的一个热点。本文将面貌真实感三维人脸处理技术引入基于颅骨的面貌复原过程,研究表现三维真实感人脸的年龄、肤色等个性
肝脏是人体最大的消化器官,肝脏疾病直接影响人的健康和生存。我国是肝癌高发病地区,晚期肝癌患者的治疗多采用肝移植手术。虽然目前我国肝脏移植的数量已经达到一定的规模,
随着计算机应用领域的日益广泛,计算机的可靠性问题越来越关键。尤其是在航空航天、银行交通、医疗、核反应监控、电讯系统等关系国计民生的领域,计算机系统一旦失效,将会引
当前城市交通系统的发展重点是如何在Internet环境下建立交通应用系统,实现广域范围内的资源共享与协同操作。并且使交城市交通系统提供的服务在面临各种事故、故障的情况下
数学形态学的基本思想是用具有一定形态的结构元素去量度和提取图像中的对应形状,以达到对图像分析和识别的目的。作为一种有效的图像处理非线性方法和理论,形态学方法在图像