噪声环境下的语音识别关键技术研究

来源 :天津理工大学 | 被引量 : 10次 | 上传用户:usaend
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
噪声是阻挡语音识别走向实用化的主要因素。为了使语音识别产品能够更好地走向实用,提高在噪声环境下的语音识别率成为当前迫切需要解决的问题。本文在研究国内外相关资料的基础上,对噪声环境下的语音识别进行了以下关键技术研究。语音预处理技术直接影响特征提取的好坏和语音识别的正确率。本文对语音信号的预处理技术进行研究,包括语音增强、预加重、分帧、加窗以及端点检测技术等噪声去除方法。本文对噪声和语音的自动分离技术进行分析,包括盲分离算法、独立分量分离法、基于遗传算法的独立分量分离法。在此基础上,提出了基于禁忌搜索的盲分离算法。搜索过程中使用禁忌搜索学习方法,以峭度作为分离矩阵的适应度,并根据基音频率选取出所需的语音信号。实验表明基于禁忌搜索的语音分离算法能够跳出局部最优,搜索到全局最优分离矩阵,将语音信号与噪声信号进行有效分离,为语音识别的后续工作打好基础。提取具有抗噪性能的特征参数是语音识别的关键。本文将具有抗噪性能的Teager-Kaiser能量算子与符合人耳听觉的Gammatone滤波器相结合,提取一种语音特征参数TECC,并采用能较好反映语音信号动态特性的差分参数,提出将TECC参数与差分TECC参数相结合,形成组合TECC参数(TECC+△TECC)。实验结果表明所提的特征参数与传统语音特征参数LPCC、MFCC及其组合MFCC参数(MFCC+△MFCC)相比具有更好的抗噪性能和识别效果。本文采用Matlab开发工具,实现了一个小词汇量语音识别系统,并介绍了系统实现方法。
其他文献
对网络恶意行为的入侵检测是当前网络安全研究的一个重要内容。现有入侵检测系统存在着检测率不高、灵活性差、不能有效识别未知攻击和规则更新滞后等缺点,借鉴生物免疫系统原
运行时系统是执行计算机程序的基本环境,如何提升其执行效率是计算机学科的研究热点与难点之一。Java虚拟机作为一种重要的运行时系统,因易于扩展、便于跟踪程序执行和程序移
随着计算机技术和多媒体技术的发展,数字图像逐渐成为人们传播信息的主要媒介之一。其在公共信道上的安全传播成为人们关注的重要问题。加密技术作为信息安全的重要技术之一,是
脉搏波是心脏射血冲击血管,经血管壁反射而形成的一种传播波。脉搏波信号能反映出人体的一些生理与病理信息,所以脉搏信号一直是人们关注和研究的重要医学信号之一。近年来随着
在目前国内250多万家制造业企业中,中小企业占90%以上,这些中小企业信息化基础薄弱,在信息化基础构建方面资金、技术、人才均缺乏。而在物资采购方面,这些中小企业存在着相互
随着社会经济的迅速发展以及互联网的普及应用,无线网络以其布线灵活、便于移动、部署容易和节约成本的优点,越来越受到各国重视并得到广泛应用。相比传统的以太网络,新兴的无线
国际形势日趋复杂,我国经济发展步入新常态,社会改革全面深化,维护国家安全稳定的任务更加繁重。传统的维稳工作中信息收集汇总难、化解处置过程动态掌握难、跟踪调度难、合
由于网络技术日趋成熟,黑客们逐步将注意力从以往对网络服务器的攻击转移到对Web应用的攻击。根据2011年Gartner的最新调查,75%的安全攻击发生在Web应用上。利用恶意的脚本代
以网上购书系统作为理论与实践的结合,实现了论文提出的Web应用开发框架,重点从表示层和业务逻辑层分析了系统的实现过程,并对系统的部署进行了描述。传统的Web应用系统普遍
加密云数据的安全检索问题是目前的热门研究话题。现如今以关键字为文档体征的加密云数据检索方案已经有很多了,这些方案能够支持不同的检索功能。但目前能够支持多关键字密