基于HMM模型的汉语数字语音识别算法的研究

被引量 : 17次 | 上传用户:wyn44298
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别是一门涉及面很广的交叉学科,它是目前发展最为迅速的信息研究领域之一,它与语音学、语言学、数理统计学和神经生理学等学科有非常密切的关系。汉语数字语音识别(mandarin digit speech recognition)的任务是识别“0”到“9”等10个非特定人汉语数字语音。本文着眼于汉语语音识别的主要问题,研究汉语语音识别的关键技术,以提高语音的识别率和识别模型的收敛速度。本文首先对现有的语音识别技术的发展现状进行了分析。在此基础上,介绍了语音识别的基本理论,包括语音信号产生的数学模型和汉语语音特征分析。在语音信号的端点检测方面提出了基于能量和过零率的改进检测方法,并进行了实验仿真和分析。其次详细阐述了线性预测倒谱系数(LPCC)及Mel频率倒谱系数(MFCC)等特征参数的提取方法,结合实验对这两种参数下的识别率进行了比较。实验证明基于MFCC的特征参数比LPCC参数具有更好的识别率。随后介绍了汉语语音识别中常用的方法,动态时间规整(DTW)理论和隐马尔可夫模型(HMM)原理。在对DTW传统方法的分析基础上,本文提出了DTW的高效算法,此高效算法可以减少计算量和存储空间。详细分析了HMM算法的三个基本问题,对实际中Viterbi算法和Baum-Welch算法中存在的下溢问题,分别采用了取对数和定标的方法加以解决。最后利用MATLAB编程实现了基于HMM的汉语数字语音识别系统,比较了HMM用于孤立词和连接词系统的识别率,并与基于DTW的孤立词识别结果作了分析和比较,分别指出了二者的优点和不足,提出了本课题研究未来改进的方向。
其他文献
在我国冻土区及跨海跨河桥梁工程中,高桩承台桩基础应用广泛。高桩承台底面一般露出地面或水面,由于具有一段自由长度,基桩的受力情况较不利,桩身内力和位移比同样水平外力作
生活环境对人的感染和影响是潜移默化的,每个人的行为的变化和思想价值观的形成,都要受所处的社会环境的影响。调查显示,有80.3%的人表示环境对自己的思想行为产生一定的影响
采用正交试验法优化了耐磨涂料配方,确定最佳耐磨涂料配方方案为:碳化硅粒度为80pm,碳化硅含量为40%(体积百分比),铬粉含量为1.5%(体积百分比),EPS颗粒余量。磨损试验表明,利用该耐磨涂料
为了弥补传统烟雾模拟在一个力场作用下运动态势的单调性,提出一种基于欧拉模型的多烟雾自由融合实时仿真算法.首先根据场景和烟源位置等初始条件提出域划分算法,从结构上解
文学(文化)外译需选择有世界文学价值的中国文学作品与能保证译本文学性、文化性、召唤性并通过文学批评促进其异域传播的译者。金介甫多年从事沈从文及中国社会历史文化研究的
<正> 一、前言皂素也称皂甙,是甙类的一种。从茶(包括茶、油茶、山茶)植物中提取的皂素称茶皂素。本文所讨论的是茶叶树(Thea sinensis)的种籽所含的茶皂素,它是属于三萜皂甙
对零售点的选址问题和关联货物配送问题建模,分别应用改进的混沌遗传算法和免疫克隆选择算法求解该模型,前者采用混沌初始化方法产生初始种群,使种群具有较好的多样性,并采用
西瓜小拱棚全程覆盖栽培技术是以小拱棚的经济投入,大拱棚的管理技术集合而成。它以低投入,高产出见效益,上市时间在大拱棚西瓜结束以后、小拱棚西瓜上市以前的断档期间,从而
研究水代法提取沙棘籽油的工艺条件,并对沙棘籽油的品质进行检测和评价。以单因素试验为基础,以沙棘籽油的出油率为目标,确定最佳工艺条件为:炒籽温度130℃、炒籽时间20min、
对水蒸气蒸馏法、溶剂萃取法以及同时蒸馏萃取发提取花椒挥发油的效果进行了比较,并通过气相色谱质谱法对3种方法的提取物种类进行了比较。结果显示水蒸气蒸馏法虽然花椒挥发