基于统计阈值的鲁棒性语音识别

来源 :重庆邮电大学学报(自然科学版) | 被引量 : 0次 | 上传用户:aqwww8
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近几十年来,语音识别系统已由实验室环境走向真实的世界中.在不同的环境噪声下,识别性能却仍不尽人意,尤其是在低信噪比的环境中.为解决在低信噪比情况下的低识别率的问题,以声学参数MFCC( Mel-frequen-cy cepstrum coefficient)为基础,提出了一种基于统计阈值的倒谱均值方差归一化算法,该算法能进一步减小训练环境和测试环境的不匹配程度,从而提升了语音识别系统对环境噪声的鲁棒性.首先,对输入的语音提取MFCC声学参数,然后对提取的声学参数作均值方差归一化处理,最后采用统计阈值的方法抑制归一化后存在变异的特征.该算法能增加带噪语音特征和纯净语音特征的相似性;与MFCC为基线的系统相比,在低信噪比情况下,该算法的错误率最高下降约40%,同时该方法也优于其他的鲁棒性特征倒谱均值减和倒谱均值归一.
其他文献
当前,随着我国高校毕业生的逐年增加,大学生"就业难"已成为困扰高校健康发展的一个难题.文章阐述了高校实施创业教育对破解毕业生"就业难"的积极意义,并在此基础上提出了高校
目的探讨血清透明质酸(HA)和Ⅲ型前胶原氨基端肽(PCⅢNP)预测早产儿支气管肺发育不良(BPD)的价值。方法选择2006年1月至2010年9月在我科住院、胎龄
目的 总结老年急性心肌梗死患者行支架置入术的监护与护理经验.方法 对2009年1月至2010年10月住院的226例老年急性心肌梗死行急诊支架置入的患者进行回顾性分析,评价老年急性
目的 探讨以家庭为中心的干预对精神分裂症患者社会功能与照料者心理健康的影响.方法 将临床"痊愈"出院的精神分裂症患者112例随机分为研究组(56例)和对照组(56例).对照组给
目的分析评价吸宫手术前口服不同剂量米索前列醇促进宫颈软化效果和药物不良反应。方法将218例早孕患者按随机数字表法分为400 pg组(110例)和600 μg组(108例),分别在行吸宫手术前
目的观察妇科腹腔镜CO2气腹时不同瑞芬太尼血浆靶浓度对七氟烷MACBAR和儿茶酚胺BAR[去甲肾上腺素BAR(minimum plasma concentration of norepinephrine for blocked adrenerg
目的观察α7亚基烟碱能乙酰胆碱受体(α7 subunit-containing nicotinic acetylcholine receptor,α7nAChR)激动剂后处理减轻大鼠在体心肌缺血/再灌注损伤(ischemia/reperfusion
目的 观察不同剂量丁二磺酸腺苷蛋氨酸治疗慢性肝内胆汁淤积的临床效果.方法 将80例肝内胆汁淤积患者按住院号随机分成3个观察亚组及1个对照组,每组20例.在基础治疗相同情况
目的 探讨肝移植治疗终末期肝泡型包虫病的临床应用价值.方法 回顾性分析2000年12月至2010年8月新疆医科大学第一附属医院收治的8例行肝移植治疗终末期肝泡型包虫病患者的临
心脏性猝死(SCD)是指由心脏病引起、发生于症状出现后1小时内、医院外或急诊室或到达医院时已经发生的死亡,其原因包括室性心动过速(VT)、心室颤动(VF)、心脏停搏或非心律失