基于深度学习的与文本无关话者确认研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户：qishikdjj

【摘要】

：

随着科学技术的不断进步,电话已经成为人们日常生活中不可或缺的一部分。在身份认证技术研究领域,越来越多的研究人员开始关注如何使用电话语音进行身份认证,因为相对于其它

【作者】

：

吴明辉

【机构】

：

中国科学技术大学

【出处】

：

中国科学技术大学

【发表日期】

：

2016年期

【关键词】

：

说话人确认高斯混合模型深度学习深度神经网络长短时记忆模型

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着科学技术的不断进步,电话已经成为人们日常生活中不可或缺的一部分。在身份认证技术研究领域,越来越多的研究人员开始关注如何使用电话语音进行身份认证,因为相对于其它身份认证技术来说,使用电话语音进行身份认证所需的设备简单、成本低、易获取,更重要的是在使用电话语音进行身份认证的过程中,用户不需要接触设备,只需要简单的说一句话,便可完成认证,大大提高了用户的接受率。另外,说话人确认技术还是语音识别技术研究领域的一个重要研究方向,所以说话人确认技术的研究不仅具有重要的理论研究意义而且还具有广泛的应用前景。目前在说话人确认研究领域中,主流的说话人建模方法都是基于概率统计模型的,其中最具代表性的概率统计说话人模型当属高斯混合模型(Gaussian Mixture Model, GMM)。高斯混合模型采用非常多的高斯概率密度函数分量,对说话人的语音特征分布进行了较好的描述,从而取得了不错的效果：但说话人确认是一个二元分类问题,而高斯混合模型只是一种概率生成性模型,其区分能力非常有限,所以需要寻找同时具有强大表征能力和很强区分能力的模型进行说话人建模。近年来,深度学习(Deep Learning，DL)理论在模式识别领域掀起了一股非常大的研究热潮,其出发点是想构建一个复杂的神经网络模型来模拟人脑的思维方式,然后对数据进行分析和处理。目前深度学习理论所依托的实现载体是深度神经网络(Deep Neural Network, DNN)。深度神经网络凭借多隐层的结构特点,使得其具有很好的表征能力和区分能力,目前在模式识别的诸多研究方向都取得了成功应用。本文主要研究内容就是将具有强大表征能力及区分能力的深度神经网络应用于说话人确认系统中进行说话人建模,构建基于深度神经网络的话者确认系统,针对建模过程中深度神经网络输入特征的选择、网络结构以及网络训练方法等关键问题进行了深入的研究,并对多种基于深度神经网络的说话人确认系统的结构及性能进行对比。首先,介绍了目前说话人确认技术研究领域最为经典的概率统计模型——高斯混合模型,并对其原理进行了详细阐述。针对其应用于说话人确认系统中使用的GMM-UBM结构进行了深入的讨论,并对GMM-UBM说话人模型训练过程中使用的MAP算法进行介绍,然后通过实验分析了混合度的选取对GMM-UBM说话人确认系统整体性能的影响,同时构建了本文研究所需的基线系统。接着,对深度神经网络相关内容展开了讨论,介绍了深度神经网络的发展历程,详细阐述了深度神经网络的原理及其训练算法,并对深度神经网络在训练过程中常出现的问题进行了重点讨论。本文针对基于GMM-UBM的说话人模型区分能力差,表征能力不足等问题,引入了深度神经网络进行说话人建模,构建了基于DNN-SPK说话人确认系统。为了进一步的减弱语音倒谱中语义信息的干扰,采用GMM对语音的原始倒谱特征进行聚类变换,抽取原始倒谱特征的统计特征参数,从而进一步突显说话人的个性信息,然后将其与深度神经网络相结合,构建基于GMM-DNN说话人确认系统,大大提高了确认的效果。最后,语音作为一种时序信号,当前时刻的信息在一定程度上是受其历史信息影响的。采用DNN进行说话人建模时,DNN对语音历史信息的记忆是非常有限的,所以引入了能够记住长历史信息的长短时记忆(Long Short Term Memory,LSTM)模型,构建了基于LSTM-SPK说话人确认系统,针对采用LSTM进行说话人建模过程中,模型结构的选择以及如何选取输入特征参数和输出说话人标签等关键问题进行详细讨论。另外,针对LSTM计算复杂度比较高的问题,探讨了采用LSTMP模型替换LSTM模型进行说话人建模的策略,最终使得话者确认系统的性能获得了明显的提升。

其他文献

基层乡镇医院原发性高血压的临床护理方法及效果

目的:研究基层乡镇医院原发性高血压的临床护理方法和效果.方法:采用回顾性的方法,对基层乡镇医院原发性高血压的临床护理方法及效果展开研究和观察.在我院选出40例临床资料,

期刊

基层乡镇原发性高血压临床护理方法和意义

鸟巢式护理在新生儿护理中的应用效果观察

目的:探讨鸟巢式护理对新生儿护理的作用.方法:选取我院新生儿进行研究,随机分为两组分别接受常规护理、鸟巢式护理,比对护理效果.结果:研究组护理满意度显著优于对照组(P＜0.0

期刊

新生儿母乳喂养鸟巢式护理并发症发热

感染性腹主动脉瘤腔内修复治疗的围术期护理方法探讨

目的:观察探讨感染性腹主动脉瘤(IAAA)腔内修复治疗的围术期护理方法.方法:以2016年1月--2019年9月为时间段,选择我院收治的感染性腹主动脉瘤腔内修复治疗患者共10例,将其随

期刊

感染性腹主动脉瘤腔内修复围术期护理

基于FDTD方法的半经典纳米结构电磁特性研究

随着科学技术的飞速发展,各种新型材料电磁特性已经成为人们的研究焦点。本文研究的纳米结构材料,就是当下的热点之一。纳米结构,是指以本身有一维度尺寸达到纳米级,即在100n

学位

时域有限差分法金属纳米结构消光截面

延续性护理在老年慢性病护理中的应用分析

目的:中国的社会结构呈现老年化趋势,老年慢性病发生率增加,患者群体也变得壮大,此时合适且有效的医学治疗及护理干预对老年慢性病病情的治疗和缓解有很大的意义.方法:本实验

期刊

延续性护理老年慢性病护理干预

指导性加强患者自我健康护理干预在慢阻肺患者中的应用效果观察

目的:探究指导性加强患者自我健康护理干预在慢阻肺患者中的应用效果.方法:本研究涉及对象为慢阻肺患者70例,研究时间为2018年6月-2019年5月,分为参照组(35例)和研究组(35 例

期刊

指导性加强护理自我健康护理慢阻肺自我护理能力

基于稀疏多带信号的压缩采样技术研究

在3 GHz以下无线电频段资源越来越拥挤的情况下,用户逐渐倾向于向高频发射窄带信号。在宽频域范围内,在同一时间通常有多个用户的信号存在,若单纯地依靠Nyquist采样方法采集

学位

宽带稀疏信号亚奈奎斯特采样调制宽带转换器1-bit压缩感知二进制迭代硬阈值

乳腺癌中CAFs通过旁分泌效应诱导肿瘤转移的表观遗传学分子机制研究

目的:　　肿瘤转移是导致乳腺癌患者死亡的重要原因之一。基质细胞和肿瘤细胞的相互作用在促进肿瘤生长和维持肿瘤的恶性表型中发挥重要作用。癌相关成纤维细胞（CAFs）作为基质

学位

乳腺癌治疗靶点成纤维细胞肿瘤转移表观遗传学

基于深度学习的与文本无关话者确认研究

其他学术论文