基于HMM建模的蒙古语连续语音识别系统的研究与实现

来源 :内蒙古大学 | 被引量 : 12次 | 上传用户:bingfeng615404
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音识别(speech recognition)是机器通过识别和理解过程把人类的语音信号转变为相应的文本或命令的技术。其根本目的是研究出一种具有听觉功能的机器,这种机器能直接接受人的语音,理解人的意图,并作出相应的反应。本文课题来源是国家高技术研究发展计划(863计划)资助的项目“蒙古语语音识别技术的研究”。 蒙古语言属阿尔泰语系,与西方语言相似是一种拼音语言。蒙古语发音时由若干音素拼接而成,但在元音和谐、辅音结合方面有自己独特的规律。结合蒙古语特点本文在蒙古语语音声学模型的设计和语言模型的建立方面做了有益的尝试。 本文使用三音子作为基本的识别单元,在词层使用了统计语言模型,用HTK作为训练和识别工具,最终采用识别率较高的HMM模型建立蒙古语连续语音识别系统。 本文共分为七章。第一章为绪论部分,论述了本课题的来源,语音识别技术研究意义,以及开发蒙古语音识别系统的意义。回顾了语音识别技术的发展历史。并简介了本文的研究内容。第二章介绍了语音识别原理、语音识别系统的分类和语音信号处理。第三章介绍了在语音识别系统中使用的隐马尔可夫模型的基本原理。包括基本概念,三个重要问题,以及连续密度隐马尔可夫模型和隐马尔可夫模型的种类。第四章介绍了蒙古语语音识别系统的语料库与语音库的建立。第五章阐述了本文所建立的基于HMM建模的蒙古语连续语音识别系统的框架及其实现以及蒙语语音识别应用技术研究。第六章是在本文建立的连续语音识别系统的基础上,通过实验检验各种模型改进和优化方法对识别率的影响。最后对下一步的工作进行了展望。
其他文献
在大型企事业单位的信息环境中通常存在着多种应用信息系统,而各系统采取的权限管理、授权服务与访问控制的方式往往各不相同,在实际应用中对于各个系统资源的访问缺少一种统一
在海量数据存储与大数据处理中,普遍采用了基于HDFS (Hadoop DistributedFile System,Hadoop分布式文件系统)架构的集群来存储数据。为支持大数据分析在海量数据上进行实时查询
本文在对系统架构进行详细分析的基础上引入Struts框架,深入研究了Struts应用框架的内部结构、工作流程及其所使用的设计模式。探讨了如何利用Struts框架,通过优化Web应用程序
随着WWW的急剧增长以及多媒体技术和通讯技术的飞速发展,快速有效地进行互联网多媒体信息检索、查询和浏览,成为人们的迫切需求。现存的图像搜索引擎,大多是采用基于文本关键
随着计算机应用技术的不断发展,计算模式从集中式转向了分布式,尤为典型的是C/S结构(Client/Server),在上个世纪八十年代及九十年代初得到广泛应用。但随着企业规模的日益扩
传统的边界防火墙存在单点失效和性能瓶颈的局限性,而且依赖于网络的拓扑结构实施其安全策略。在网络高速发展的今天,传统防火墙的局限性越发显得明显。分布式防火墙正是在这样
随着无线局域网得到越来越广泛的应用,研究无线宽带接入互联网的基础理论与关键技术具有重大的科学和经济意义,提供高性能的无线互联网传输协议是实现无线宽带接入互联网要解
在存储系统中,CPU的处理速度远大于磁盘等I/O设备的读写速度,两者间的速度不匹配严重影响了系统整体性能。预取技术能够有效地弥补I/O设备与CPU之间的速度差异,因此被广泛应用。
网格技术将所有可用于共享的资源(例如,计算机、高性能设备、昂贵仪器、存储设备、科学数据、软件、数据库等)通过网络连接起来,并将它们转化成一种随处可得的、可靠的、标准
相对于传统的磁质机械硬盘,基于闪存的固态硬盘具有更高的读写速度、更低的能耗、更好的抗震性和更低的噪音。因此,固态硬盘正越来越多地被运用在计算机系统中。但是,因为固态硬