论文部分内容阅读
现实生活中,人类能够在复杂的环境下将注意力集中于感兴趣目标的说话内容,语音分离的目的就是为了让计算机也具备这种能力,即在众多说话人背景下提取出感兴趣的一个或多个说话人的语音。麦克风阵列在时域和频域的基础上增加了空间域,为语音分离算法提供了一个新的思路,就是根据声源空间位置的不同对不同声源进行分离。本文就是按这个思路进行语音分离算法的研究,主要工作概括如下:第一,分析了语音信号的特性和声波传播特性,在传统阵列信号处理的基础上,研究了麦克风均匀线性阵列的近场、远场信号模型。第二,针对基于麦克风阵列的高分辨率参数估计(如MUSIC)和波束形成参数估计(如MVDR)方法在抗噪性方面的不足,利用阵列信号的稀疏性将信号稀疏分解算法应用于声源定位,通过实验仿真验证了该算法在低信噪比情况下有较好的鲁棒性,而且能够对相干信源进行定位估计;基于稀疏分解的声源定位算法是通过不同的方位参数建立原子库,并通过全局搜索寻找最佳原子,这样导致了该算法复杂度较高,计算量大,针对这一问题,使用基于近场扇区划分的匹配追踪算法,大大的减少了MP分解算法的计算量,为MP分解算法应用于实时系统提供了可能。第三,研究了近场自适应波束形成算法,使用麦克风阵列近场模型将传统MVDR波束形成算法应用于近场环境,针对MVDR波束形成算法稳健性方面的不足,研究了近场稳健MVDR波束形成(RCB)算法,使得MVDR波束形成算法具有对导向矢量误差和有限样本效应的双重鲁棒性。第四,结合声源定位算法和波束形成算法通过使用MATLAB仿真演示语音分离效果。