基于HHT与信息融合的说话人识别技术研究

来源 :桂林电子科技大学 | 被引量 : 0次 | 上传用户:lbfjm78
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和通信技术的迅速发展,个人身份认证已经广泛渗透到人们的日常生活中,并且变得越来越重要。作为一种生物认证技术,说话人识别是从语音信号中提取出反映说话人生理和行为特征的语音参数,通过对这些参数的分析,最终识别说话人身份的过程。说话人识别技术具有不会被遗失、方便使用和可靠性高等优点,其广泛的应用前景正受到越来越多学者的重视。  说话人识别技术大体上可以分为特征参数提取和识别模型两部分。因此,要改善说话人识别系统的性能就可以从以上两方面入手。本文用希尔伯特-黄变换(HHT)对语音信号进行处理,由此提取语音特征参数,并在此基础上提出了基于矢量量化的说话人识别融合模型,获得了一些初步研究结果。本文的主要工作如下:  (1)首先对说话人识别技术的研究背景、基本原理以及研究现状进行阐述,针对目前研究中存在的问题进行分析。  (2)详细论述了HHT的原理,揭示其本质特征和用于信号处理的优点。初步阐明了HHT应用于语音信号分析的有效性。  (3)将HHT的核心—经验模态分解(EMD)和短时处理技术相结合,提取语音特征参数,记为 IMFCC参数;以 HHT为工具,分析语音信号的边际谱特性,在此基础上提取语音特征参数,记为IMF-BJP参数。  (4)利用IMFCC和IMF-BJP特征参数,采用矢量量化的方法进行说话人辨识实验。实验结果表明:单独的IMFCC参数作为特征的说话人识别效果并不理想;对比MFCC参数,以 IMF-BJP参数进行实验时,在短语音情况下,IMF-BJP的识别效果要更好些,而且语音时长越短,它的优势越明显,随着语音时长的增加,两种参数的识别率差距逐渐缩小。  (5)结合信息融合理论,提出了基于多数规则判决的融合系统和基于串联方式的二次判决融合系统。实验结果表明:与传统的独立 MFCC判决系统比较,在短语音情况下,基于多数规则判决的融合系统的性能最优,基于二次判决的融合系统次之,独立 MFCC判决系统最差。随着语音时长的增加,基于二次判决的融合系统的识别率提高幅度最大,它的效果最好,基于多数规则判决的融合系统的识别率趋于平稳,但仍优于独立MFCC判决系统。  本文提出的算法在短语音识别的实际应用中体现了较强的优势,这对于在尽可能少的语音数据下,实现高性能的说话人识别系统的研究具有一定的实际意义。
其他文献
本文以国家“863”项目“胜利油田浅海海底管线电缆检测与维修装置”为研究对象,围绕着特种潜器的对线控位技术,对其系统建模、仿真及控制等技术进行了研究。由于本文所研究潜
APC控制系统是工业控制中广泛应用的一种控制系统,尤其在带材和板材生产过程中,为了提高生产效率,希望位置控制的机械(如轧机的压下、剪切机定尺等)能在最短的时间内到达给定目
电力能源作为推动世界工业发展的坚强动力,它的发展已成为世界各国头等重要的大事。当前,电力系统稳定控制问题已取得了许多突破性的进展,如灵活交流输电系统的出现。本文的出发点即以对该系统的重要组成成员SVG的研究而深入展开。关于无功补偿问题的研究已经持续了很长的历史,然而早先设计无功补偿装置的基本思路仅局限于对某一设定的工作点模型进行线性化处理,因此所设计的控制器很难达到要求的性能。近年来,由于广义Ha
RoboCup通过提供广大研究者一个标准的比赛平台,以多智能系统实时对抗的形式来促进多智能体协作的研究,成为当前国际人工智能研究领域的新热点。  本文首先对仿真比赛系统