应用DIVA模型处理中文语音信号方法的研究

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:yudalong880210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着对脑功能成像研究的深入,人类对语音运动控制的机理有了一定的共识。基于此,波士顿大学Guenther教授带领的研究小组提出了一个专门用于解释语音生成和获取过程的神经计算模型DIVA(Directions Into Velocities of Articulators)。然而,作为DIVA模型输入的脑电信号(ElectroEncephaloGram,EEG)表现出非平稳性且具有多种多形态瞬时结构波形,在采集过程中极易受到各种噪声的干扰,影响到模型对语音的正常处理。因此,本文在稀疏分解思想的基础上,提出了一种专门适用于脑电信号结构的过完备原子库构建方法来代替原有的Gabor原子库,以达到去噪目的,进而提高DIVA模型的语音学习能力。本文首先简述了DIVA模型的基本原理和各组件间的作用及联系,并探讨了作为模型输入的脑电信号的基本特性,同时对各传统脑电信号去噪方法的原理和优缺点做了专门说明。然后,详细描述了新的稀疏分解原子库的构造步骤,仿真实验表明了该原子库较传统的Gabor原子库具有更优的稀疏性,并且对脑电信号的重构效果更好。接着,在分析了稀疏分解的去噪原理后,应用这种原子库消除了混杂在EEG信号中的噪声,与传统的小波去噪方法相比较,去噪效果明显。最后,针对DIVA模型原有语音--体觉映射算法存在的缺陷,结合自适应组织映射及粒子群优化混合算法,将去噪后的脑电信号输入到DIVA模型中,有效的提高了DIVA模型在学习中文元音发音时的聚类效果及发音精度。本文所做的研究在改善DIVA模型性能的同时,也为今后将其应用于中文的发音奠定了良好的基础,对今后解决语言功能障碍有重要的作用。
其他文献
信息技术的快速发展聚集了海量的网络数据。如何从海量数据中快速有效地获取信息正面临着巨大的挑战。在社会网络分析领域,链接预测作为网络结构研究的一个关键问题,不仅要考
随着数字化技术的发展,视频资源日益丰富,但是部分违规视频也掺杂其中,违规视频对社会造成了极大的危害,因此,对视频进行监测已经成为亟需解决的问题。视频监测的两个重要特
随着互联网的快速发展,海量的信息以各种方式出现,其中最主要的还是文本信息,因此文本自动分类成为了国内外研究的热点,现在已经出现了大量有效的分类方法,例如:Naive Bayes、
信息技术的蓬勃发展大大促进了人类社会的进步。网上信息交流、电子商务、办公自动化、自动控制技术等信息技术极大地减轻了人们的劳动强度,方便了人们的工作、学习和生活。因
工作流管理系统越来越多的应用到电子商务与电子政务中,并已经取得了很好的应用。随着信息技术的不断发展,工作流系统变得越来越复杂,在满足应用需求的同时对其安全性有了更
网格门户是利用Web应用技术对网格资源和服务进行集成,给用户提供一个透明的针对特定问题的专有视图,降低了用户使用网格的复杂性。用户能够通过熟悉的Web界面、方便一致的操
作业车间调度问题(Job-Shop Scheduling Problem JSSP)是一种典型的组合优化问题,在工程应用中有着十分重要的地位。本文在研究现有JSSP求解方法的基础上,重点关注了基于免疫
第三方物流做为一种先进的组织方式和管理技术,被广泛认为是继降低物资消耗、提高劳动生产率之后的第三利润源泉。因此,研究物流系统建模技术及建立准确的物流系统模型,对更好地
随着网络技术的迅猛发展,WWW已成为信息发布、交互及获取的主要工具,它涉及新闻、广告、消费、金融、教育、电子商务等许多领域。Web具有四个特点:庞大性、动态性、异构性、
随着彩色信息在相关领域得到越来越广泛的应用,人们对色彩再现的质量也提出了更高的要求。色外观匹配技术是跨媒体色彩管理的一个重要组成部分。本文针对传统色彩管理技术不