基于可区分性特征学习的说话人识别方法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:yukitolee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
说话人识别在生物识别技术中是一个非常重要的任务,具有远程验证的独特优势,并且获取途径简单、成本低廉。因此,说话人识别技术的应用范围非常广泛,几乎可以应用到人们日常生活的各个角落,如公安司法、通信、国防军事、银行系统、互联网等领域。目前,已存在的说话人识别技术通常是从大量的训练样本中学习到特定说话人的相关语音特征。如何从语音信号中提取到最能够区分不同说话人身份信息的特征,是直接影响识别性能的一个关键因素。近年来,在复杂环境下录制的语音数据集越来越多,并且数据集的规模也越来越大,甚至出现数十万和上百万条语音的说话人识别语音数据库。在复杂的大规模语音数据集下,传统模型的学习能力相对于深度学习模型十分有限,导致识别性能急剧下降。基于上述挑战,分别提出基于字典学习的潜在可区分性说话人特征学习方法和基于边阈角度损失的多频信息卷积说话人识别方法,论文的主要内容和创新点如下:(1)提出基于字典学习的潜在可区分性说话人特征学习方法。该方法利用字典学习构建潜在特征映射空间,通过引入说话人嵌入查找表,发现来自同一说话人不同语音信号之间的相关性,并引入重构约束学习线性映射矩阵,使得该方法从大量语音信号中学习到的潜在特征不仅具有可区分性,而且来自同一说话人的潜在特征还具有相关性。实验结果表明,在TIMIT数据集上两个不同的实验设置下,分别与现有的最好两个方法相比,基于字典学习的潜在可区分性说话人特征学习方法准确率分别提高2.38%和3.12%。在INTERSPEECH2019的The Fearless Challenge数据集Apollo上,该方法在开发集和验证集上得到的准确率比基线方法分别提高32.98%和36.33%。(2)提出基于边阈角度损失的多频信息卷积说话人识别方法。提出一种新的损失函数,称为边阈角度损失,它可以直接将说话人的特征映射到超球面,在超球面上,角度直接对应于说话人的相似性度量。再利用一种称为Octave的新式卷积运算,建立一个从语音频谱中独立地分离高频信息和低频信息的深度卷积网络特征提取器,该特征提取器能够从不同的频率信息中捕获说话人特征能量聚集的部分,得到多频特征。然后再由边阈角度损失学习可区分性说话人特征用于说话人识别。在TIMIT数据集和VoxCeleb数据集上的实验结果表明,提出的边阈角度损失的多频信息卷积说话人识别方法在说话人识别准确率上表现优异,充分证明了所提方法的有效性。(3)设计并实现说话人识别原型系统。采用编程语音Python、Matlab和深度学习框架Pytorch设计并实现基于潜在可区分性特征学习的说话人识别原型系统。该系统包含语音信号的预处理、特征提取、说话人模型匹配以及结果输出四个模块。其中,提出的基于潜在可区分性说话人特征学习方法和基于边阈角度损失的多频信息卷积说话人识别方法均在该原型系统中得以实现。该说话人识别原型系统的实现,展示和验证本文提出方法的有效性和实用性。
其他文献
随着移动技术的日益演进以及用户日益增长的功能需求,无线数据流量的爆炸性增长,使得5G移动通信技术正在进行迅速的研究与开发。为了满足对数据业务的巨大需求,毫米波(Millim
乌兰察布市地处国际公认的马铃薯黄金产业带,所生产的马铃薯富含丰富的营养成分。目前,乌兰察布市已成为我国重要的种薯、商品薯和加工专用薯生产基地,马铃薯是乌兰察布市的
学位
中国现代体育观与美育观一样,皆发轫于国族救亡年代。为了强兵御侮,洋务重臣在十九世纪中后期引进了西方现代兵操,开启了中国现代体育;随后的维新派以及革命党人,虽对体育的
在皮革工业中,皮革材料性能参数的检测对其加工工艺的参数制定和工艺选择有着重要指导意义,根据国家标准规定,当皮革试样缓慢受热收缩时产生0.15mm的微小形变(位移)的时刻即为皮革收缩的开始时刻,而此时刻所对应的温度定义为该皮革试样的收缩温度。所以对微小位移量的实时准确检测是皮革收缩温度参数检测过程中的主要技术难题。因此在陕西省科学技术发展计划项目基金的支持下,我们设计了一款基于机器视觉的皮革收缩温度
含铝复合固体推进剂燃烧时,铝颗粒在燃面会发生团聚,燃烧生成大粒径的液相含铝凝团。大尺寸的液相含铝凝团在燃烧流场的作用下,导致发动机出现二相流损失、熔渣沉积以及绝热层烧蚀加剧等问题,甚至会堵塞喷管喉部,带来严重后果。因此,解决铝粉燃烧团聚问题对于提高固体推进剂的综合性能非常重要。本论文合成了全氟辛酸铁(Fe(PFO)_3),对其结构及性质进行了表征。首先研究了Fe(PFO)_3对高氯酸铵热分解的影响
癫痫是一种慢性的神经疾病,影响着全球约1%的人口。癫痫是由局部脑区不正常的电活动引起的,其急促、反复的发病特点,不但会影响患者的生活,甚至会对患者的生命造成危害。目前
目的通过研究人类白细胞抗原(Human Leucocyte Antigen,HLA)与风热疮之间的相关性来了解风热疮的发病机制,起到未病先防的作用,可降低发病率,也为临床治疗提供免疫学基础,同时为实现精准医学提供科学依据。另一方面研究风热疮的中医证型与HLA之间的相关性,有助于我们从基因水平认识中医的证,从微观学角度对风热疮的中医辨证提供一种更加准确、便捷的诊疗方式。方法通过搜集整理有关文献,按照
近年来,随着全国新课改工作的不断推进深入,各学科的传统教学模式都发生着极大的变化,不仅课堂主体从教师转换到了学生,传统的教学观念和固化教学方式也正面临着巨大的转变,需要更多的反思与突破。身处信息化时代,如何将技术与教育深度融合,使得课堂教学最大化地促进学生的个性化发展成为了教育领域研究的焦点之一。在此背景下,本研究基于CTCL“学习”范式,关注学生在进行具体课程学习前的认知起点,并以初中语文文言文
随着医学成像技术和光声技术的不断融合,人工智能技术的不断进步提高了光声成像数据的精确度以及临床试验的合理性,生命科学及基础医学相关设备的升级换代大幅度提高了检测效率和准确度。超分辨成像技术正在帮助医生和研究人员在面对医学挑战时不断突破和创新。超分辨成像是医生和研究人员观测各种生命数据的一种新型技术,而多维超分辨成像仪器是观测人员使用这一技术的载体。在超分辨成像仪在外观设计过程中需要设计者考虑到,如