采用归一化补偿变换的与文本无关的说话人识别

来源 :声学学报 | 被引量 : 0次 | 上传用户：x21501027

【摘要】

：

在噪声环境下,特别是当说话人识别最常用的模型——高斯混合模型(GMM)失配的情况下,需要对其输出帧似然概率的统计特性进行补偿。文章根据说话人识别的声学特性,提出了一种非

【作者】

：

包永强赵力邹采荣

【机构】

：

东南大学无线电工程系,东南大学无线电工程系,东南大学无线电工程系南京 210096,南京 210096,南京 210096

【出处】

：

声学学报

【发表日期】

：

2006年01期

【关键词】

：

归一化补偿变换方法与文本无关说话人识别系统高斯混合模型噪声和干扰输出识别率帧似然概率最大似然噪声环境语音统计特性声学特性理论分析

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在噪声环境下,特别是当说话人识别最常用的模型——高斯混合模型(GMM)失配的情况下,需要对其输出帧似然概率的统计特性进行补偿。文章根据说话人识别的声学特性,提出了一种非线性变换方法——归一化补偿变换。理论分析和实验结果表明:与常用的最大似然(ML)变换相比,该变换能够提高系统识别率,最大可达3．7％,同时可降低误识率,最大可达45．1％。结果说明归一化补偿变换方法基本克服了在与文本无关说话人识别系统中,当说话人的个性特征不断变化、语音与噪声不能很好地分离或者降噪算法对语音有损伤、模型不能很好地匹配时,需要对模型输出的似然概率(得分)进行补偿的局限。这也说明对模型输出的似然概率进行处理是降低噪声和干扰的影响、提高说话人识别率的有效方法。 Under the noise environment, especially when the GMM mismatch, which is the most commonly used model for speaker recognition, needs to compensate the statistical properties of the output frame likelihood probability. According to the acoustic characteristics of speaker recognition, a nonlinear transformation method - normalized compensation transformation is proposed. The theoretical analysis and experimental results show that compared with the maximum likelihood (ML) transform, the proposed transform can increase the system recognition rate up to 3.7% and reduce the false positive rate up to 45.1% . The results show that the method of normalized compensation transformation basically overcomes in the text independent speaker recognition system, when the speaker’s personality characteristics are constantly changing, the speech and noise can not be separated well or the noise reduction algorithm can damage the speech, the model can not be very good When matched well, there is a limit to the likelihood that the model outputs the likelihood probability (score). This also shows that processing the likelihood of the model output probability is an effective way to reduce the influence of noise and interference and improve the speaker recognition rate.

其他文献

决策树结构对说话人自适应影响的研究

提出一种利用自适应语料和训练语料对模型状态结构调整的算法。该算法在易混淆的状态间参数共享,提高了模型对样本的后验概率和对自适应语料的利用率,并间接地调整了系统决策

期刊

决策树树结构说话人自适应speaker adaptation训练语料系统识别率状态算法模型结构调整后验概率参数共享利用率样本实验

山区斜坡填土场地桩基础设计计算的有关问题

为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7

期刊

穿越荆棘

呈现在我们面前的。无疑是一条充满荆棘的路。当前，中国经济下行压力在不断加大,已成为经济运行中的主要予盾. 受多种种因素影响,在经历连续多年的高速增长后,中国经济景气已

期刊

中国经济经济运行经济景气高速增长影响因素压力经历

基于听觉特性的音频水印能量估计及自适应嵌入算法研究

基于水印能量对提高水印鲁棒性的重要作用,提出了音频水印载体可以嵌入最大水印能量的估计方法。该方法利用了听觉掩蔽特性及MPEG-2听觉模型,计算音频载体在变换域下每帧数据

期刊

音频水印归一化掩蔽曲线水印嵌入嵌入算法水印嵌入强度听觉特性

高职院校创新创业教育实践教学模式研究

"大众创业、万众创新"这一概念的提出,大力推动了大学生自主创业的发展,创新创业需要具有较强的综合素质,这些综合素质需要学校通过实践教学来提高,本文从高职院校创新创业教

期刊

高职院校创新创业教育实践教学模式

鲍雅丹，何辉在护理实验教学中情境领导理论的应用分析

目的：探讨情境领导理论在护理实验教学中的应用效果，实现该理论的推广。方法：将2013年1月到6月采取传统授课方式的班级作为对照组，选取2013年7月到12月采取情境领导理论教学的班

期刊

护理实验教学情境领导理论应用效果

普通话的普及对西安方言的影响 ——1980年至今

80年代我国改革开放力度加大,人口流动加剧,西安成为外地人口的聚集区,普通话普及的步伐加快,西安的本地方言的使用和内部结构系统受到很大影响。西安方言作为中原官话中具有

期刊

普通话普及西安方言变化影响

高校教师学术评价指标体系设计

高校在对教师进行学术评价时主要针对的是他们的学术成果，实质上是对教师的学术评价转化为对教师学术成果的评价。以质量为导向的学术评价体系的研究中，非常重要的内容就是高校教师学术成果评价指标体系的构建。　　一、评价指标　　评价指标是对评价对象某个或某些属性的概括。作为评价指标，它必须在质和量两方面都可以确定。评价指标通常应是多指标、分层次、有权重、有约束条件，评价指标体系在逻辑上是自洽的，不宜太多或太少

期刊

高校教师学术评价体系评价指标体系学术成果有约束条件评价对象质和量多指标转化属性质量权重逻辑构建分层

青藏高原东北部新构造运动特征

为探究吕家坨井田地质构造格局,根据钻孔勘探资料,采用分形理论和趋势面分析方法,研究了井田7

期刊

Hopping planning of the bionic leg mechanism driven by PAMs with biarticular muscle

本文通过对荣华二采区10

期刊

bionic legpneumatic artificial muscle ( PAM )biarticular musclebionic hopping

采用归一化补偿变换的与文本无关的说话人识别

其他学术论文