混响环境中的视-听语音识别

来源 :电声技术 | 被引量 : 0次 | 上传用户：kongling54321

【摘要】

：

针对混响环境中语音识别率相对安静环境下急剧下降的问题，提出了一种将语音视觉信息与音频特征相结合的方法。通过快速检测和定位包含说话人唇部的感兴趣区域（ROI），获得ROI图像序

【作者】

：

万书婷曾向阳王强

【机构】

：

西北工业大学

【出处】

：

电声技术

【发表日期】

：

2012年12期

【关键词】

：

语音识别混响视-听特征融合隐马尔可夫模型 speech recognition reverberation audio-visual integr

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

针对混响环境中语音识别率相对安静环境下急剧下降的问题，提出了一种将语音视觉信息与音频特征相结合的方法。通过快速检测和定位包含说话人唇部的感兴趣区域（ROI），获得ROI图像序列。首先对ROI图像进行离散余弦变换，提取反映说话人唇动的视觉特征。音频特征的提取，则采用较为成熟的Mel频率倒谱系数（MF—CC）方法。对所获取的视、音特征采用隐马尔可夫模型作为训练识别算法。测试实验结果证明，采用视、听特征相结合的方法，有效地提高了混响环境中的语音识别率。

其他文献

右旋美托咪啶在乳突根治术术后自控镇痛中的应用

目的探讨右旋美托咪啶在乳突根治术术后自控镇痛中的安全性与效能。方法选择60例行乳突根治术患者随机分为2组：右旋美托咪啶组（D组）和芬太尼组（F组）,每组30例。观察D、F组患者术前

期刊

右旋美托咪啶乳突根治术镇痛镇静

手持技术在国内化学教学中的应用研究进展

通过查阅国内手持技术研究的期刊论文、学位论文和著作，对国内手持技术研究的内容和发展历程进行分析，并在对比分析国内外手持技术研究的基础上，对今后的的研究提出建议：拓宽传感

期刊

手持技术实验开发理论研究教学策略研究性学习科学探究

液压系统清洁度的计算机仿真

分析液压系统清洁度需要建立与系统对应的数学模型并求解，人工完成这一过程较为复杂。近年来随着计算机科学技术的发展，利用计算机仿真技术对液压系统清洁度分析已经成为可能。

期刊

液压系统清洁度计算机仿真

基于脉冲周期的单元被动测距

为了解决单元被动测距的问题，提出了一种基于脉冲周期的单元被动测距法。该方法适用于目标发射固定周期脉冲信号，推导了目标运动参数与单元接收信号脉冲周期的关系式，构建一个长

期刊

脉冲周期最小二乘被动测距pulse periods least squares passive ranging

研究性学习与化学科课程教学整合研究

从“研究性学习课程整合化学科课程内容开发课程资源”和“化学学科开展研究性学习的方法与途径”两方面对研究性学习与化学科教学整合进行了研究与实践，提出了“开展研究性学

期刊

研究性学习化学教学课程资源课堂教学

中药湿敷在誉捷联合顺铂化疗中的应用

目的观察中药湿敷在预防誉捷联合顺铂化疗致静脉炎发生中的作用。方法将114例行誉捷联合顺铂化疗的肺癌患者按入院顺序随机分为观察组62例,对照组52例;观察组患者在化疗前静

期刊

中药湿敷肺癌化疗护理

ZH-3000真空自耗电弧炉液压系统改进

该文从ZH-3000电弧炉保压时间变短这一现象分析入手，查出故障源为液压锁，并对液压回路进行改造，使系统简化，备件标准化。

期刊

电弧炉保压泄漏标准化

超声在锁骨上臂丛神经阻滞定位中的应用

目的研究锁骨上臂丛神经与其周围组织结构的毗邻关系,为超声引导下锁骨上臂丛神经阻滞的临床优化应用提供解剖学基础。方法应用超声对200例ASAⅠ-Ⅱ级患者的左右双侧锁骨上臂

期刊

超声检查臂丛锁骨下动脉ultrasonography brachial plexus subclavian artery

混响环境中的视-听语音识别

其他学术论文