基于听觉特性和录音检测的说话人识别研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:lsw19880811
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何提高说话人识别系统的识别率和鲁棒性,一直是语音识别领域研究的重点;而说话人识别系统的安全性能,又会影响其后续的推广与应用。在实际应用中,说话人识别系统会受到假冒声音的攻击,而利用录音设备录制说话人的声音再通过回放来攻击说话人系统是相对容易的。所以,能够设计出具有识别回放录音功能的说话人系统是很有必要并且具有实际应用意义的。  本文从提高说话人识别系统识别率、鲁棒性和安全性出发,对语音特征参数的提取方法进行了改进,并对如何防止录音回放攻击进行了实验研究,最终实现了具有良好性能的防录音回放攻击的说话人识别系统,主要内容如下:  1、在实验室现有语音库的基础上,建立了回放录音库。  2、提取出了更符合人耳听觉特性的特征参数GCFCC,该提取方法不仅用更符合人耳蜗基底膜特性的Gammachirp听觉滤波器代替MFCC中的三角滤波器,而且还从听觉神经元动作电位发放率与声强的饱和关系出发,拟合发放率—声强幂函数曲线,用拟合得到的幂函数取代MFCC的对数函数。在基于GMM的说话人辨认系统中进行实验,实验结果表明,同MFCC相比,使用GCFCC特征参数的说话人辨认系统在识别率和鲁棒性上均有明显提高。  3、建立了基于语音静音的录音检测模块,其中用自适应子带谱熵法提取静音,并针对信道信息本身的特点改进了MFCC特征。通过用GMM-UBM模型作为录音的检测模型,建立录音确认模型,验证了方法的有效性。  4、将建立的录音检测模块应用在基于GMM的说话人识别系统的前端,并与没有加入录音检测模块的GMM说话人识别系统的性能进行对比,实验结果显示加入录音检测模块的说话人识别系统的等错误率下降了20%左右,证明本文建立的录音检测模块能够提高系统的安全性。最后对本文的全部工作进行了总结,并进一步指出本文研究的不足之处和改进方向。
其他文献
随着社会的发展和科技前所未有的进步,我国国民生活水平也随着经济的飞速发展而不断提高,如今,汽车进入千家万户,为人们出行提供便利的同时,相应的交通事故高发率却也给难以计数的
随着火力发电领域节能减排战略的实施,对循环流化床(CFB)机组的自动控制水平提出了更高的要求。针对CFB机组燃烧过程的自动控制进行深入研究,具有非常重要的实际意义。本文在详细阐述CFB锅炉工作原理的基础上,针对传统建模和控制方式的局限性,从智能方法着手,重点对实际机组燃烧系统中的主汽压和床温进行模型和控制系统的研究。针对电厂的现场条件,利用实际运行数据,以BP神经网络为工具,分别获得了给煤-主汽压
传统的旅游线路是由旅游机构根据多数人的偏好并结合旅游景区的特色而设计的,这些线路主要用于满足团队旅游的需求。不同于团队旅游,个人自助游需要游客参与到旅游线路制定,并向
双目立体视觉技术是机器人视觉领域的一个重要课题。它的目的在于重构场景的三维几何信息。主要包括图像采集、图像预处理和特征提取、摄像机标定、立体匹配以及三维重建。本
每一个多媒体技术的使用者都期望从接收端得到清晰的良好的视频图像视觉质量,但是由于信道容量的局限,图像或视频序列通常都会被降质,从而以低分辨率进行传输和存储,这样就导
随着计算机技术、现代传感技术和数字图像处理技术的发展,机器视觉技术已广泛应用于产品质量检测、机械加工、精密测量、振动检测及机器人等领域,尤其是将机器视觉技术应用到
无线传感器网络(WSN)在军事、环境、生产、医疗等方面有着非常广泛的运用前景。传感器节点成本低、体积小,但是在无线传感器网络中,能量非常的有限。节点经常被部署在无人值守
安全多方计算研究的是在一个分布式网络中,存在多个由于某种利益关系而互不信任的参与者各自提供秘密输入共同执行计算任务,设计协议使得每个参与者得到相应计算结果的同时,又不
当前离散制造业的制造执行系统由于内部功能不一致而缺乏普适性,制造执行系统开发厂商也因缺乏通用的参考模型而在开发时需针对不同的企业需求重新建立不同的模型,这些均导致了
近些年来,带钢表面缺陷检测技术正在向高速度、高精度以及智能化方向发展。目前,基于机器视觉的缺陷检测方法已成为国内外在该领域的研究热点。采用机器视觉的检测方案需要对