层叠与深度神经网络研究及其在语音分离中的应用

来源 :内蒙古大学 | 被引量 : 7次 | 上传用户:huanxytt
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语音是人类交流的最重要媒介,而多数语音出现在噪声环境之中。听力正常的人可以不受噪声干扰,而听力障碍者和语音识别系统都难以处理混有噪声的语音,这就需要语音分离处理。语音分离是一个去除语音中噪声的过程,也就是将目标语音从背景噪声中分离出来的过程。计算听觉场景分析(Computational Auditory Scene Analysis, CAS A)理论分析了人类完成语音分离任务的过程,研究了语音信号的表示方法,提出了完成语音分离任务的计算目标。根据计算听觉场景分析,来完成语音分离任务将是一个很有前景的研究方向。目前,根据计算听觉场景分析理论,研究者们将语音分离任务视为一个两类分类问题,对每一个语音分离单位(时间-频率单元,Time-Frequency unit, T-F unit)做出分类决策,判断其是属于噪声的一类还是属于目标语音的一类。当前研究者提出的方法是在分类时使用复杂特征,并且都是一次处理一个语音分离单位。而这些复杂特征的提取是十分耗时的,加之一次只处理一个单位,使得整个过程的时间复杂度变得很高。这就极大地限制了计算听觉场景分析方法的应用,比如,这些方法就难以应用在像助听器这样的资源受限且要求实时处理的设备中。基于当前语音分离方法的不足,针对“使用复杂特征”和“一次处理一个单位”这两个使整个语音分离过程时间复杂度很高的因素,本文通过使用简单特征,简化了特征提取步骤,减小了计算量,而且我们提出的方法可以成批次地生成计算结果,从而加快了整个语音分离过程的速度。除此之外,为了进一步提高语音分离系统的分类准确率,我们使用了层叠神经网络(Stacked Neural Network)模型。该模型可以刻画复杂的函数关系,它将多个简单神经网络模型一层层叠起来,并将下层网络的输出作为上层网络输入的一部分,这样上层网络的工作可以在下层网络工作的基础上完成,那么随着层叠网络层次的增多,准确率也能够逐步地得到提升。同样,深度神经网络(Deep Neural Network)模型是一个包含有多个隐层的神经网络,它也可以刻画复杂的函数关系,但层叠神经网络具有更高的灵活性,这种灵活性可以使我们在训练过程中加入指导信息,进而影响训练进程,可以进一步提升语音分离系统的性能。所以,本文使用层叠神经网络而不是深度神经网络。我们将本文提出的方法与已知的性能最好的——基于深度神经网络和支持向量机的方法在相同的实验数据集上做比较,我们的方法不仅在准确率方面上略有优势,而且在处理速度上有大幅提升,可以使整个语音分离处理过程实时完成。
其他文献
随着社会的发展,信息技术有了跨越式的进步,新型智能移动终端设备的存储能力和计算能力都有了很大的提高。在这样的大背景下,传统的键盘输入屏幕输出的单调人机交互方式越来
近年来起重机吊装在现代建筑工程中日渐普遍,起重机的路径规划问题一直备受关注,RRT随机采样算法成为理论研究中最为广泛的一种路径规划算法。然而,由于RRT算法在节点采样时
车载自组织网络中分布式网络应用的发展迫切需求高效路由策略的支持,尤其是单点到单点的单播和单点到多点的广播。而车辆节点的高速移动和受限于街道的分布特征导致全网拓扑
随着无线通讯技术的发展和随车装载设备功能和性能的不断提升,自治车联云(Autonomous Vehicular Cloud, AVC)的概念应运而生。车联云的建立是传统车联网(Vehicular Ad-hoc Ne
膜计算是一种分布式、并行计算模型,又被称为P系统。膜计算旨在从生命细胞的结构和功能以及组织、器官和高级生物组织中细胞群的协作中抽象出计算模型,具有分布式、极大并行性
近几年来,互联网技术飞速发展,社交格局发生新变化,人们更多的依赖网络来表达自己的观点看法。这使得网络中的信息数量海量的增长,人们也越来越多的依赖网络来获取资料,而当
随着大数据时代的到来,Internet时时刻刻都在释放出海量数据。信息的日积月累,无论是围绕着企业的商业决策,还是个人的生活消费习惯等信息,都变成了以各种各样形式存储的数据
随着最近这些年以来,计算机图形学技术的高速发展,以及计算机硬件性能的急速提升真,人们对于视觉效果的逼真性要求也随之越来越高。在游戏和电影领域,逼真的渲染效果变得越来
Internet的快速发展,基于Web的应用与人们的生活和工作越来越紧密联系在一起。很多传统的信息系统被移植到互联网上,微博、电子商务、社交网站等新型的应用模式也在层出不穷
随着信息技术不断发展,云教育、在线辅导等技术逐渐成为热点。由于传统在线教育辅导系统习题结构单一、难于数据挖掘、学习效率低等诸多因素导致其难以普及应用。智能教育辅