基于HMM的汉语数字语音识别系统研究

被引量 : 0次 | 上传用户:syscom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人与机器之间进行交流的重要工具,语音识别技术就是让机器听懂人类的语音并执行相关动作,具有广泛的应用背景。虽然在这方面的研究有很多,但目前仍有许多问题有待进一步探索。 语音的声学模型和识别理论是构建语音识别系统的基础。本文首先介绍了语音的声学模型结构,然后按照语音识别系统的处理步骤详细地分析了各个过程。在语音信号的端点检测方面提出了改进的谱熵算法,实验表明用该方法进行端点检测后提取特征参数可提高语音识别系统的鲁棒性。特征参数的选取对整个语音识别系统的实时性、鲁棒性有很大的影响。文中对语音信号的短时时域特征和语谱图进行分析后,详细阐述了线性预测分析系数(LPC)、线性预测倒谱系数(LPCC)及Mel频率倒谱系数(MFCC)等特征参数的提取方法,并对其失真测度进行了讨论。 文中论述了动态时间归整理论和隐马尔可夫模型原理,用MATLAB语言编程研究了它们在语音识别系统中的应用。用DTW理论进行孤立词语音识别时比较了特定人和非特定人识别及特征参数的选择对识别率的影响。此外,实际构建了基于HMM模型的非特定人小型孤立词语音识别的整个系统,该系统可选用不同的特征参数,具有较好的鲁棒性。用该系统对“0~9”十个数字进行了识别实验,实验发现用LPCC参数时,选取12维的识别效果最好;26维的MFCC参数的识别率比12维的LPCC参数的识别率高10%左右。
其他文献
开闭件是车身关键运动件,其灵活性、坚固性、密封性等因素对汽车产品的使用质量有严重的影响。因此,生产商对开闭件的制造均十分重视,开闭件质量的好坏,实际上也直接反映了生
该选题是来源于国家社科基金项目《区域创新系统的激发、演化机理与区域发展的实证研究》(编号:01BJL046)的子课题。从人类社会的发展轨迹来看,创新对一个国家或地区的经济增
<正>据资料显示,我国已成为世界主要农产品出口国之一。2002年我国蔬菜在亚洲市场占有率就高达41.2%。在亚洲已有绝对优势。然而,不容乐观的是,我国农产品的出口方式基本属于
为了解决自动测量系统中的自动聚焦问题 ,在普通光学显微镜上加装了自动载物台 ,并设计了相关的软硬件接口。在自动测量系统的开发过程中 ,提出了判定图像清晰度的八邻点平方
本文通过查阅研究港口吞吐量发展的相关文献,总结得出:以往港口发展的研究方法通常以定量分析居多,相应地创建了多种分析研究模型,如回归分析法、指数预测法、灰色轨迹预测法
本篇论文主要是从认知心理学的理论出发,结合物理规律的特点和中学生心理发展规律,分析学生学习物理规律的认知障碍。认知心理学的主要研究对象是感知、记忆、想象、思维、注
新疆乌鲁木齐县后峡煤田东部矿区煤层煤类以气煤为主,矿区按沉积盆地和构造分为7个含煤单元,各单元受构造运动的影响,单元内发育的煤层和煤层厚度、结构、赋存范围均有较大变
<正> 随着当代篮球运动的发展,技术、战术变化很快,比赛速度越来越快,攻守对抗性越来越激烈。特别是篮板球的争夺更趋激烈。动作力量性强,身体接触多,制高点高,运动员的身体
目前全国范围内对于商场积分/返券的消费优惠金额是否缴纳增值税没有明确的规定,各地方基层税务机关相应的税款征收尺度不一。在这种情况下,文章提出了统一和明确商场积分/返
在甘肃省科技攻关计划资助下,开展高速剪切设备的虚拟开发研究。以高速剪切设备创新设计为研究对象,进行新型高速剪切设备的虚拟开发。 根据剪切技术的概念和技术特点,简