论文部分内容阅读
语音识别是一门集语言学、信号处理、计算机技术于一身的综合性学科。其广阔的应用前景,广泛的应用领域使大量的科学研究人员长期以来一直关注着它,并投入大量精力对其进行研究。其中基于HMM优秀的时域建模能力以及ANN强大的分类能力的理论研究已在语音识别领域取得了出色的表现。本文对现有语音识别技术的发展进行了分析,详细介绍了语音识别的基本理论,包括组成、分类、预处理、特征提取以及双门限检测法等常用方法。并对线性预测倒谱系数和Mel频率倒谱系数的原理及提取过程做了较深入的研究。重点对HMM模型和PNN的原理及其在语音识别中的应用进行了研究,并就其各自的识别特性与优缺点进行了分析比较。将HMM强大的时域建模能力和PNN优秀的分类能力相互补偿,提出了基于HMM和PNN的混合模型和算法,即使用VQ作为HMM的前端,对二次提取后的LPCC参数和MFCC参数进行矢量量化,将量化后的结果作为HMM的输入。在此基础上通过Viterbi解码产生的状态转移积累输出作为PNN的输入,由PNN输入得到最终的识别结果。本文在Matlab7.0环境下对HMM和HMM/PNN模型进行了特定人、非特定人识别仿真,并在加噪的条件下对两种模型的识别率进行了比较。由仿真得到的识别数据可证明,与传统的HMM相比,该混合模型的识别性能更优,在抗噪性能上也优于HMM。