论文部分内容阅读
语音识别技术已经越来越广泛的应用到人们的日常生活工作中,涉及到该技术的应用有:语音拨号、检索文档、简单的数据听写录入等。而其与其他语音合成技术相结合,还能组成更为复杂的技术,例如语音同声翻译。综合了语音识别技术的市场需求及其市场走势,本论文研究了一种能对特定词进行识别的孤立词语音识别系统。该系统是在MATLAB的基础上编写程序并加以实现的。针对这一系统的实现,本论文做了以下几个方面的工作:(1)对目前国内外几种比较重要的语音识别方法进行了介绍,并对相关训练技术:DTW、HMM、ANN做了简要分析。(2)对语音信号的产生机理及特性做了简要分析,并介绍了语音信号的预加重、分帧和加窗、端点检测等环节,尤其针对特征参数提取的算法做了详细的研究和分析,在介绍了LPC以及LPCC预测系数之外,对美尔频标倒谱系数(MFCC)做了重点研究,最后以加权美尔频标倒谱系数(WMFCC)作为特征参数来进行特征提取。(3)在利用DTW算法进行匹配的环节,从DTW算法的路径约束和失真测度矩阵分块计算方面进行了改进,改进后的算法大大减少了模板匹配时的计算量提高了系统识别速度。(4)最后,通过利用MATLAB仿真,对本文所设计语音识别系统的环节进行仿真实现实现,在参数提取中,由于利用了加权梅尔频标倒谱系数,使得所提取的特征参数更能体现人的基音周期。