论文部分内容阅读
竞争说话者的干扰是语音通信过程中一种常见的干扰情况。人类的听觉系统可以在多个讲话者的环境中区分和跟踪自己感兴趣的语音信号,并分辨出自己所需要的声音,这种分辨能力是人体内部语音理解机理所特有的一种感知能力,也就是人类的语音分离的能力,称为“鸡尾酒会效应”。 在语音和听觉信号处理领域中,如何从多个说话者的混叠语音信号中分离出各个语音源信号或提取出人们感兴趣的目标语音,来模仿人类的语音分离能力,成为一个重要的研究问题。这也是稳健(Robust)语音信号处理中的一个重要研究方向,对语音识别、语音增强等都有着非常积极的促进意义。 目前的混叠语音分离大多是建立在无噪环境中的混叠情形下,主要以盲源分离(Blind Source Separation,BSS)和计算声场景分析(Computational Auditory Scene Analysis,CASA)两类方法为主,前者是根据信号的统计特性从几个观测信号中恢复出未知的独立源成分;后者则是利用人耳的听觉感知要素从混叠语音中分离出感兴趣的目标语音。通常为了研究方便,这些算法都不考虑环境噪声的影响。然而,在实际语音通信中,不可避免会受到周围环境噪声的影响,因此寻找有效的带噪混叠语音分离方法具有非常重要的理论价值和实际意义。 带噪混叠语音包含了多个说话者和环境噪声,其分离较为困难。目前,一些学者正致力于带噪盲源分离算法的研究,但总体研究成果不多;而噪声环境中的感知要素检测困难使计算声场景分析方法受到一定的局限性。国内外现有的关于带噪混叠语音分离的研究成果非常少。 独立分量分析(Independent Component Analysis,ICA),是在研究盲源分离过程中出现的一种新兴的盲分离技术,自其出现便成为信号处理、数值分析、统计及神经网络等领域中的热点研究问题,并在语音处理、生物医学信号处理、模式识别、特征提取、数据压缩、图像处理和电子通讯等方面获得了非常广泛的应用。目前已有不少学者提出了多种有效的ICA算法,但是这些ICA算法大多都不考虑环境噪声的影响,在解决无噪或低噪情况下的混叠语音分离时具有非常优越的分离性能,但是当环境噪声较大时分离效