基于耳蜗倒谱系数特征的说话人识别研究

来源 :湘潭大学 | 被引量 : 0次 | 上传用户:ahqmchy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物识别技术中,说话人识别技术是一种较为常见的识别技术,同时说话人识别技术的许多研究和应用也越来越多的被人们所关注。说话人识别技术就是让机器模拟人耳的特性,来对说话人进行识别和确认。人耳作为人的听觉器官在说话人识别过程中具有良好的抗噪性能和识别能力,因此更多的学者和研究人员都致力于对人耳的听觉特性进行研究。基于人耳听觉特性所提出的一些算法虽然识别性能都较好,但在噪声环境下识别效果仍然欠佳。针对这种问题,本文从人耳听觉特性算法进行研究,发现耳蜗倒谱系数(Cochlear Filter Cepstral Coefficient,CFCC)在噪声环境下识别效果相对较好。因此本文对CFCC进行进一步的研究,提高其算法的整体识别效果。论文的主要工作如下:1、提出融合非线性幂函数和维纳滤波的CFCC算法。首先,将语音信号经过维纳滤波算法,提高其语音信号的信噪比;然后,将CFCC融合非线性幂函数,得到新的CFCC(NCFCC),提高了高信噪比条件下算法的识别率;再将经过维纳滤波的语音信号作为NCFCC的输入语音信号;最后,对该算法进行说话人识别。试验结果表明,与梅尔频率倒谱系数、Gammatone频率倒谱系数和CFCC相比,所提出的算法提高了说话人整体识别率,同时在噪声条件下具有良好的鲁棒性。2、提出将Mel滤波器组融入到CFCC中得到新的特征算法MFCFCC。首先,将语音信号输入到Mel滤波器组中进行滤波,变成二维的语音信号;然后,通过加权求和方法将二维语音信号变为一维语音信号,再将得到的语音信号经过CFCC过程;最后,得到新的说话人识别特征MFCFCC。试验结果表明,MFCFCC与其它特征算法比较,其在噪声环境下,能显著提高说话人的识别率,在纯净语音条件下也能提高识别性能。
其他文献
随着我国经济的不断发展和人民生活水平提高,对基础设施的需求日益增长,尤其是方便快捷的高速公路,高速公路对拉动我国经济增长具有重要作用。目前我国高速公路总里程占全国
本文通过试验,研究总结出一套应用VSP井信息的多域融合多次波识别、衰减及质控的配套技术。实践证明,VSP井资料信息用于地面地震资料多次波识别及衰减处理参数标定更加可靠。
随着汽车行业的高速发展和汽车生产制造技术的革新换代,镀锌高强钢板被广泛应用于汽车制造及相关领域中,但是为了抗腐蚀而使用的镀锌层却引起了其他隐患。Q&P 980镀锌钢板作
颅内动脉瘤是颅内动脉血管壁的病理性囊性膨出,是致使蛛网膜下腔出血的最主要病因,有非常高的致残率和病死率。血流动力学因素被视为动脉瘤发生,发展及破裂的重要因素之一。
社会转型快速发展,推动了中国社会的深入变革,也同时突显了中国社会的若干矛盾。在社会转型的冲击下,各民族的传统民族文化逐渐式微。本文通过对大量文献资料的收集查阅,通过
随着脉冲功率技术的发展与进步,以及军事、医疗等领域对高电压、大电流脉冲功率技术的严格要求,高电压、大电流脉冲发生器得到了越来越广泛的应用,所以对脉冲发生器测试技术
改革开放以来,中国进入了快速发展时期,各项基础设施建设迅速发展。天津市红桥区自2007年以后加快了基础设施建设,在中央和市委的帮助下,完成了西站地区的改扩建,尤其是道路
冷却结晶过程是从含一种或多种成分的反应溶液中获取固体晶体产物的重要环节,广泛地用于精细化工和制药工程。为实时调控优化冷却结晶过程,迫切需求先进的在线监测晶体生长过
燃尽风量和过量空气系数是燃煤发电锅炉运行中重要的调节参数,对锅炉的效率和NO_x生成特性均会产生重要影响,研究锅炉效率与NO_x生成综合最优时的燃尽风量和过量空气系数对于提升锅炉的经济性和环保性具有重要理论和实际意义。本文以一台2030t/h对冲燃煤锅炉作为研究对象,建立了锅炉效率与NO_x生成耦合的定量评价指标,根据该评价指标设计并进行了100%、75%和50%三个负荷的锅炉变燃尽风量和变过量空
一种新型六自由度并联机构是针对传统Stewart六自由度并联机构在动态高负载状态下刚性不足问题而提出的一种八杆六自由度并联机构。一种新型六自由度并联机构(称八杆六自由度并联机构)通过控制运动过程中不同支链的锁定解锁状态将六自由度并联机构演化成少自由度并联机构来实现机构在高负载状态下运动的稳定性。八杆六自由度并联机构是变胞机构的一种特殊应用形式同时也是大型多细胞混联机构的一个缩影,因此针对八杆六自由