汉语连续语音的音节自动标注算法研究及实现

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:fugh824
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对连续语音语料库进行切分或标注是整个连续语音识别系统的基础和前提,而且也是一项非常重要的工作,因为它对语料库的充分利用有重要作用,对连续语音识别系统的性能有重要影响。传统的切分或标注语音库的方法是靠人工手工完成,这种方式不但工作效率很低、工作量太大,而且切分数据的准确性也得不到保证,所以一种能够自动、准确切分或标注语音库的方法显得特别有意义和研究价值。在近几年使用隐马尔可夫模型的语音识别已经成为主导,从已经发表的相关论文的数量和在重要的语音会议上所作的讲座的数量就可以证明。此方法之所以如此受欢迎,其原因有以下几点,一是其内在的统计的(数学上准确)框架,二是从有限的训练集语音数据估计出模型参数的训练算法的易用性和可用性,三是结果识别系统的灵活性,可以改变模型的大小、类型或者结构来配合特殊的话语、声音等等,最后是整个识别系统实现的简单性。本文通过对隐马尔可夫模型的研究,提出了汉语连续语音音节自动切分的方法。这种音节自动标注算法,可以将存在大量协同发音现象的连续语音切分成一个个音节。在本文中也将此方法与采用其它技术实现的自动标注方法进行对比,在本文中所实现的其它技术包括基于归并的音节切分自动机,最大熵模型。在连续语音上的切分实验结果说明这种基于HMM的音节自动标注算法是准确而可靠的。
其他文献
近年来,计算机通信技术的发展和Internet的普及,使数字信息和产品的传播更加方便和广泛,但与此同时,软件版权保护也成为人们亟待解决的问题。软件水印作为一门新兴的软件版权
软件演化在软件生命周期中必不可少,当前体系结构的运行时动态演化已经成为许多软件系统的根本需求,而支持动态体系结构的运行平台以及实现框架是其中的关键问题。另外,当前
随着World Wide Web的飞速发展,Deep Web中蕴含了海量的可供访问的信息,并且还在迅速的增长。这些信息要通过查询接口在线访问其后端的Web数据库得到。尽管丰富的信息蕴藏在D
计算机网络是把分布在不同地理区域的计算机,通过通信线路互连成一个规模大、功能强的网络系统,从而可以方便的互相传递信息,共享硬件、软件、数据信息资源。家庭宽带接入业
近年来,我国进入人口老龄化迅速发展时期,老年人口呈现总量扩张、增量提速的发展态势。面对日益加剧的人口老龄化现象,长远的计划安排和积极的战略应对是必不可少的。在老年人中,听力损失患病率非常高,是仅次于关节炎和高血压的常见慢性疾病,并随着年龄增长发病率逐渐升高。因此在积极应对人口老龄化,大力发展老龄服务事业和产业的过程中,老年人的听力损失是一项值得引起我们重点关注的问题。听觉器官老化属于自然规律,目前
本课题以协同工作平台服务系统(CWPS)的研究开发为背景,以分布式对象计算技术思想为指导,结合面向对象/面向构件的方法论,提出了共享接口网关软件模型。运用设计模式等软件体
壳的出现,使软件保护进入了一个新的时代。加壳技术已广泛应用于软件保护,在软件逆向分析、软件解密和恶意软件检测等过程中,软件脱壳已成为十分重要的环节之一。软件壳检测
视频监视系统是安全防范系统的重要组成部分,它是一种防范能力以及实用性都很强的综合系统。然而近年来,随着嵌入式技术、多媒体技术、计算机网络等的快速发展,视频监视系统
2G移动网络为了实现交换与控制的分离,引入移动智能网作为增值业务的开发与运行平台,而3G移动网络为了提供更为开放的业务开发模式,引入应用服务器作为主要的电信业务运行平
调度问题是工农业生产、国防、科研、交通运输以及各种服务行业中普遍遇到的问题。调度问题要研究的主要内容就是根据产品制造需求合理分配产品制造资源,进而达到合理利用产品