语音合成在语音验证码中的应用研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户：ltzmh

【摘要】

：

语音合成也称为TTS(TexttoSpeech)是近年来语音技术研究的热点之一。随着人机交互智能化的日益发展，语音合成技术也日趋成熟，其合成出的语音的可懂度和清晰度都达到了不错的效

【作者】

：

张玉维

【机构】

：

重庆大学

【出处】

：

重庆大学

【发表日期】

：

2011年期

【关键词】

：

语音合成语音验证码韵律结构鲁棒性

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

语音合成也称为TTS(TexttoSpeech)是近年来语音技术研究的热点之一。随着人机交互智能化的日益发展，语音合成技术也日趋成熟，其合成出的语音的可懂度和清晰度都达到了不错的效果。所以人们产生了对语音合成技术多样化的需求，比如说情感语音合成、个性化语音合成、多语言语音合成等，这些都需要通过对语音韵律模型的研究和调整韵律参数来实现。　　本文首先介绍了语音合成和语音信号处理的常用方法及如何进行文本分析的方法。其次，重点研究了韵律结构、韵律模型和时长分析。在对语音韵律建模的时候，要先对其进行韵律标注，常用的有ToBI(ToneofBreakIndex)和SSML(SpeechSynthesisMarkupLanguage)标注。着重研究基于规则的韵律模型，对常用的韵律参数规则进行了总结。然后，对时长分析方法做了进一步的改进。　　最后，实现了语音合成系统，并把语音合成应用到语音验证码中。　　在此基础之上，本文的主要研究内容和工作如下：　　(1)对语音韵律结构进行分析和标注，为下一步的韵律模型和合成打下基础。研究语音合成中的韵律模型，详细阐述常用韵律参数的规则以及建模方法。重点对时长进行分析，研究变速不变调的关键技术，并对时长分析做了改进。介绍了提取共振峰参数的方法，然后构造合成所需的语音库，详细阐述了合成步骤并最终实现了基于共振峰合成的合成系统。　　(2)提出了一种基于共振峰合成和韵律调整的语音验证码方法Sound-basedCAPTCHA(CompletelyAutomatedPublicTuringtesttotellComputersandHumanApart)。验证码是用来区分用户是人类还是机器程序的一种安全机制。常用的验证码都是基于图片的，这些不适合残障人士使用。近年来也有很多语音验证码方面的研究，但是还存在一些不足，很多方法都未考虑如何更好的抵御自动语音识别技术ASR(AutomaticSpeechRecognition)的攻击。　　(3)所提出的方法提高了语音验证码的健壮性，弥补了现有语音验证码的不足。这种方法选择最小的语音单位音素作为合成基元，在合成过程中基于规则调整韵律参数，特别是设置语音参数为随机值，使得合成出的语音的速度和韵律具有不确定性和不可预测性，从而有效降低了自动语音识别技术ASR对语音验证码的识别率，增强了语音验证码的鲁棒性。　　(4)对合成出的语音验证码分别进行人耳识别和ASR识别测试，并通过MOS(MeanOpinionScore)主观评价和MFCC(Mel-FrequenceCeptralCoefficients)参数距离客观评价来评测合成出的语音。

其他文献

基于内容与结构的文本挖掘方法及其分布式应用研究

在当今信息爆炸的时代,海量数据不断涌现,而且这些数据仍在以每三个月增长一倍的速度持续增长着。因此,如果不借助有效的信息挖掘方法,这些异构海量数据将可能最终变成无人关

学位

文本挖掘全文检索分词距离文本结构Solr Cloud

基于“环境-行为”本体模型的软件可信演化研究

近年来,软件的可信性问题再度引起广泛关注,航空、核工业、电信、金融、电力和交通等国家重要领域的信息化程度日益提高,国家基础设施的运转越来越依赖于大型分布式软件系统,

学位

环境-行为本体推理软件可信动态环境可信演化

基于主动学习的半监督谱聚类算法研究

聚类技术是用于数据分析的最常应用的技术之一,其应用领域涉及统计学、计算机科学、生物学以及社会学等。传统的聚类算法如常见的K-means算法,EM算法等都是建立在凸状分布的

学位

谱聚类半监督主动学习

基于点击流的Web数据挖掘研究与应用

随着Internet的飞速发展,网络已经成为对外宣传以及了解世界的窗口。万维网(World Wide Web)为人们提供丰富信息的同时,也留下了用户浏览页面时的大量访问信息。如何利用这些

学位

web日志挖掘点击流点击流数据仓库商业智能

新闻话题事件演变关系自动生成系统的设计和实现

话题检测与跟踪(TDT)作为一项帮助人们解决信息过载问题的研究，它通过对新闻流中新话题的识别和追踪，将某个话题相关的报道聚集并呈现给用户。但新闻话题的浏览不应该局限于扁

学位

新闻话题演变关系话题检测话题追踪类比学习自动生成系统

几种认证加密算法的分析研究

现代密码技术作为信息安全的基础受到了广泛的关注和高度的重视,提出能适应各行各业且安全性较好、成本较低廉、结构较简单的认证加密工作模式已成为现代密码技术研究的热点

学位

认证加密CAESAR竞赛分组密码泄露状态伪造攻击差分路径

使用基于语义的混合聚类算法的用户兴趣建模

自从1991年Internet上万维网公共服务的首次亮相，各种各样的信息就以指数级的增长速度充斥于Internet中，人们寻找信息的方式也随之发生了变化。从最原始的手工查找，到书签服务，再

学位

用户兴趣模型混合聚类算法语义信息偏好向量个性化服务

基于立体视觉的手形手势识别研究

随着信息技术的迅猛发展,人机交互也越来越成为日常生活中一个不可缺少的部分,人机接口技术的发展也越来越快。传统的鼠标键盘等人机交互手段虽然越来越向方便快捷性方向发展

学位

手势分割手势识别特征提取隐马尔科夫模型

基于WTP的动态三维测量技术研究

动态三维面形测量技术是三维面形测量技术的一种动态的、实时测量方法。利用动态三维面形测量技术能简单、方便、快捷地对被测物体进行测量,例如:产品的在线检测、铁路钢轨表

学位

动态三维测量小波变换轮廓术投影仪标定傅里叶变换轮廓术

基于场景语义的人群疏散仿真环境构建研究

近些年来,随着各种火灾事故和紧急事件频繁的发生,人群聚集的公共场合中突发事件的安全疏散仿真模拟越来越受到重视。对于人员密集和流动性较大的场所如学校、化工厂、旅游景

学位

环境建模场景语义路径规划人群运动

语音合成在语音验证码中的应用研究

其他学术论文