噪声环境下说话人识别方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:xiaoliang1978
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,说话人识别在纯净语音的环境下识别率相当高,但在噪声条件下识别性能急剧下降。现在,人们提出了多种方法去提高说话人识别的性能,但仍有很多问题需要解决,如训练环境与测试环境之间不匹配等,本文主要对环境不匹配问题展开讨论。 目前解决环境之间不匹配的方法主要分成两种:前端特征降噪处理,包括鲁棒性特征提取;后端的特征、模型、得分补偿方法等。 本文对目前常用的前端降噪方法和鲁棒性特征进行了介绍,分析了其对说话人识别的性能改善程度和缺陷。文章的重点在后端的特征分析上,主要从特征补偿和得分补偿两方面进行改进。 特征补偿:利用泰勒多项式进行模型参数补偿的原理,本文在考虑加性噪声的环境下,采用自回归多项式,以信噪比作为自变量,进行特征参数的补偿,改善了说话人识别率,并提高了系统的执行效率,为说话人识别的实时性应用提供了一种思路。 得分补偿:文中分析发现,在噪声的环境下,导致说话人识别率下降的原因之一为,说话人的某些受噪声干扰严重的帧与训练时的纯净帧的不匹配,对说话人的得分起了畸变作用,从而使得识别性能降低。由于信噪比可作为语音帧信号畸变程度的衡量指标之一,文章采用帧信噪比参数对说话人识别中的帧得分进行加权,以改善说话人识别的性能。同时,说话人识别中高层特征信息抗噪性能要明显优于低层的倒谱特征信息,说话人的基音周期的分布可作为高层信息的一种,但单纯的高层信息由于其易于被模仿。因此本文结合倒谱特征参数,利用帧信噪比作为融合权重,对高低层信息进行融合,改善了说话人识别的性能。
其他文献
自动调制识别技术在多体制通信互联、无线电监测、通信侦察等领域有着重要的应用价值。本文采用模式识别思想对目前常用的数字调制方式的自动识别原理和方法进行了深入的分析
随着我国数字电视产业的飞速发展,以及2008年北京奥运会的临近,数字电视机顶盒也迈开了崭新的步伐。带硬盘的PVR机顶盒已经成为高端数字电视机顶盒新的发展趋势。本课题针对P
计算机信息技术和网络技术的不断迅猛发展,使得多媒体信息的传输及复制也变得越来越容易,但多媒体信息在传输和复制的过程中所引发的安全问题也是不能被忽视的。数字水印技术
随着航天航空电子技术的快速发展以及复杂的电子设备的增加,信息的传输变得越来越频繁,交换在其中扮演了重要的角色。本文结合实验室承接的“航天专用分组交换机的设计与实现
人脸表情识别技术作为人机交互的一个分支,在计算机视觉、人工智能等领域有着广泛的应用。随着应用的深入,对人脸表情识别的精确性、适应性和高效性都提出了更高的要求。根据人
CDMA技术是具有广阔发展前景的通信技术之一,并广泛应用于军事通信和民用通信中。近十几年来,人们对无线多媒体业务的需求越来越大,提高频谱利用率成为解决这一问题的有效手
在卫星通信领域,针对低轨卫星移动通信系统的研究是近年的热点。位置管理技术作为低轨卫星移动通信系统的一项关键技术,关系着整个网络的性能,对低轨卫星位置管理技术的研究
运动目标检测与跟踪是计算机视觉的核心课题之一,它融合了图像处理、模式识别、人工智能、自动控制等相关领域的研究成果,在视频监控、视频编码、视频检索、医学图像分析、智能
阵列信号处理是信号处理领域内的一个重要分支,在雷达、通信、声纳、地震、射线天文等科技领域取得了广泛的应用。空间谱估计技术作为阵列信号处理的主要研究领域之一,在理论
随着光纤传输的普及和多媒体技术的不断发展,利用光纤实时传输压缩的数字视频信号已经成为远程监控领域一个重要的研究方向。同时,媒体处理器在多媒体技术设计中功能强大,使