【摘 要】
:
作为一种非接触式的生物特征识别技术,说话人认证在智能家居、社保认证和金融安全等领域获得了广泛的运用。深度学习的发展进一步促进了说话人认证技术的提升。但是,远场认证依然是一个很有挑战性的研究课题。注册声音样本和认证声音样本由于录制距离不同,导致信噪比差异较大,严重降低了说话人认证性能。为了提升说话人认证技术的远距离交互性能,通常采用的方法是使用信号增强技术提升远场声音信号的质量,但由于引入了非线性处
论文部分内容阅读
作为一种非接触式的生物特征识别技术,说话人认证在智能家居、社保认证和金融安全等领域获得了广泛的运用。深度学习的发展进一步促进了说话人认证技术的提升。但是,远场认证依然是一个很有挑战性的研究课题。注册声音样本和认证声音样本由于录制距离不同,导致信噪比差异较大,严重降低了说话人认证性能。为了提升说话人认证技术的远距离交互性能,通常采用的方法是使用信号增强技术提升远场声音信号的质量,但由于引入了非线性处理函数,容易造成部分说话人特征信息丢失,降低认证性能。除此之外,基于特征空间降维、分解的差异补偿算法也被应用在远场说话人认证中。通过将不同距离的说话人特征向量先降维,再映射到同一个特征空间内来消除距离差异对认证结果的影响。但是,这种补偿算法需要专门训练打分模型,不是端到端的解决方案,并且认证性能依赖特征空间的选择和说话人特征向量的概率分布。针对现有远场说话人认证算法的不足之处,本文主要做了以下工作:第一,引入距离标签作为监督信息。将说话人分类作为主任务,将距离判别作为辅助任务来判断两条输入声音样本是否具有相同的距离标签,促使模型学习到距离差异信息,并通过梯度反转层将该差异信息从说话人特征中进行消除,使说话人特征对距离不敏感。第二,结合多任务学习和梯度反转层。利用多任务学习激励距离差异信息的表达,利用梯度反转层抑制距离差异信息对说话人特征的影响。在模型中的说话人特征层前面直接加入距离判别任务,在该层之后通过梯度反转层再次接入距离判别分支。先激励距离差异信息的表达再对其进行抑制可以进一步提升远场说话人认证性能。第三,使用动态损失权重更新策略调整训练过程中,各个任务的损失值在总的损失值中所占的比重。根据训练时各个任务的收敛速度动态调整损失权重,使各个任务可以同时达到最优的优化效果,充分挖掘样本间的距离差异信息。本文在Hi-mia数据集上进行实验。将远场说话人认证分为两类,即近场注册远场认证和远场注册远场认证。分别使用残差神经网络(Deep residual network,Res Net)和时延神经网络(Time Delay Neural Networks,TDNN)作为基础网络结构,结合多任务学习和梯度反转层,并且将距离判别作为辅助任务。实验结果表明,结合多任务学习和梯度反转层的结构在两类任务上分别取得了6.68%和7.07%的等误率(Equal Error Rate,EER),相比较于单任务基准模型,分别相对提升了6.69%和10.3%。本文提出的算法可以在不进行信号增强和不单独训练后端打分模型的前提下提升远场说话人认证性能。
其他文献
Al掺杂ZnO(AZO)薄膜由于具有优异的光学性能和良好的电学性能、制备成本低、对环境友好、能够应用于柔性器件等优点,在太阳能电池、有机显示、紫外光探测等领域有广泛的应用前景。原子层沉积(ALD)技术具备膜厚可控、低温生长等优点,能够制备高质量、平整性良好的薄膜。本文采用ALD方法制备AZO薄膜,借助XRD、SEM、Hall测试以及UV-Vis吸收谱等手段,研究了沉积温度和Al掺杂含量与AZO薄膜
鼠李糖脂是由微生物发酵生产得到的一种具有乳化、起泡、润湿、分散疏水性物质等功能的生物表面活性剂,具有良好的生物相容性、生物降解性及低毒性,在不同温度、p H值和盐度范围内显示出稳定的活性,广泛应用于生物修复、农业、医疗、日化、食品等领域,是合成表面活性剂的理想替代品。鼠李糖脂是由多种同系物组成的混合物,发酵菌株、培养基组成及发酵条件会影响鼠李糖脂组成及性质,鼠李糖脂的分离纯化存在纯度低、成本高等问
基于变形是提高镁合金强韧性的重要途径,但镁滑移系少,成形性能较差,限制其推广应用。铸态组织细化可明显缩短镁锭均匀化处理时间,并提高塑性成形性能。本文基于氧化物孕育Mg-Al基(AZ31B和AZ80)合金,实现组织细化,主要研究Mg-RE合金屑氧化粉末种类和加入量等对合金中α-Mg和β-Mg17Al12的细化效果,及其孕育细化对均匀化退火过程和轧制性能的影响规律,基于组织观测和理论分析探讨其影响机制
表面等离激元光学结构和器件可以实现在纳米尺度上操纵和控制光子,为发展全光集成和更高效的纳米光子学器件提供了一个可靠的途径,并且在生物传感、光学传感、纳米光子学器件、高密度光存储等应用领域具有很好的前景,成为了当前众多科学家重点关注的课题。利用光与金属纳米结构相互作用产生的天线效应、局域场增强效应,可以为设计新一代的更快、更灵敏的集成光子学器件做基础。本论文主要讨论光与金属纳米颗粒双聚体结构相互作用
水凝胶是一种三维网络结构的材料,其具有的高含水量和优异的生物兼容性特征使得水凝胶在柔性器件、生物医学工程领域具有广泛应用,尤其在药物输送、软骨修复等医学应用中展现了巨大价值。然而水凝胶软而弱的力学特征和低精度低效的成型手段,使得水凝胶无法满足一些对强度和外貌结构要求较高的应用,例如骨组织修复。骨的模量往往在兆帕级别,而传统水凝胶模量仅在1-100 k Pa级别,这使得在骨组织修复中,植入的水凝胶力
在大数据和智能化引领的网络时代中,视频监控系统逐步实现网络化和数字化,为人们提供了及时、直观的信息,在城市治安、交通管理、楼宇安防等方面发挥着不可替代的作用。与此同时,视频监控系统也面临着一系列的安全性问题,频繁出现的视频监控数据假冒、伪造、篡改等事件对视频监控数据的可信性构成了严重威胁。特别是在司法取证的过程中,视频监控数据作为电子证据,其可信性至关重要。因此,需要针对此类视频监控系统的特征与安
近年来,粤港澳大湾区大气污染防治取得了阶段性成效,细颗粒物浓度逐年下降,但臭氧浓度不断攀升,大范围臭氧污染频繁发生,臭氧已经成为影响粤港澳大湾区环境空气质量的首要污染物。在这一背景下,粤港澳大湾区臭氧的研究得到了极大关注,但研究的重点主要是近地表的臭氧及其形成机理,相对缺乏垂直方向上臭氧的研究,粤港澳大湾区臭氧垂直分布如何?受哪些机制的影响?这些研究对于地表臭氧、气候变迁及臭氧污染防控政策的制定极
在过去的几十年中,人们提出用各种各样的工艺制备不同尺度大小的金属杂化物,包括从块体金属到金属纳米材料,它们在电化学、光电化学等各个领域发挥着重要作用。与块状金属相比,具有独特结构和形貌的纳米材料通常表现出更好的性能。最近,在纳米材料上负载单原子而形成的单原子材料得到了研究者的广泛关注,其掺杂导致的无序度上升,配位环境不饱和,单原子与载体的相互作用等等,使材料的活性位点增多,大大提高了材料的导电和催
白光LED的荧光粉涂覆封装是生产过程中最重要的一环,此过程直接影响着白光LED产品的发光效果与品质。目前许多白光LED的荧光粉涂覆都是采用机械涂覆设备来完成,然而机械设备的运行难免会出现故障,当生产规模比较大的时候,需要消耗大量的人力资源,而且可能出现对生产设备监管不力的情况。对于白光LED的荧光粉涂覆工艺,生产参数的细微偏差就会严重影响LED产品的质量和性能,所以需要对生产过程参数实时监控,保证
当前国际国内的经济形势与能源形势正在发生深刻变化,我国能源生产量和消费量均已居世界前列,但在能源供给和利用方式上存在着一系列突出问题,如能源结构不合理、能源利用效率不高、可再生能源开发利用比例低、能源安全利用水平有待进一步提高等。研究冷热电混合能源联合优化配置可以有效地为区域电网综合能源利用效率的提升提供有利技术支持,提高对分布式光伏等可再生能源的消纳能力,实现冷热电混合能源和电网峰谷的匹配,促进