论文部分内容阅读
基于麦克风阵列的声源定位已经成为信号处理领域的研究热点之一,在军事、视频会议、智能机器人以及语音增强等方面有着广泛的应用前景。相关研究工作具有较强的实际价值和理论意义。本文在研究和分析了三类基于麦克风阵列的声源定位方法的基础上,深入研究了基于时延估计的声源定位方法;详细阐述了时延估计算法的原理,验证了算法在室内环境下的时延估计精度;最后建立了一种实时的声源定位系统,并将其应用于云台转向控制中,获得了较为理想的应用效果。本文具体的工作内容分为以下几个方面:(1)声源定位方法:本文介绍了三类基于麦克风阵列的声源定位方法:Ⅰ.基于高分辨率谱估计的声源定位方法;Ⅱ.基于最大输出功率的可控波束形成的声源定位方法;Ⅲ.基于时延估计的声源定位方法,并讨论了三种定位算法的优缺点及应用场合。(2)麦克风阵列的信号模型及拓扑结构:首先,本文介绍了阵列信号的远场模型和近场模型,并给出了经验的区分公式。其次,给出了四种常见的阵列拓扑结构:线性阵列,T型阵列,十字型阵列和圆形阵列。最后,讨论了如何合理选择麦克风阵列的间距和阵元的数目。(3)时延估计算法:在基于时延估计的声源定位方法中,时延估计的精度决定着声源定位的精度。本文深入研究了广义互相关时延估计算法、自适应时延估计算法和基于人耳特点的时延估计算法,讨论了广义互相关在不同加权函数下的表现性能,并通过实验验证算法在室内环境下的定位精度。(4)系统实现:本文提出了一种切实可行的实时声源定位系统,并将其应用于云台转向控制中。在系统中,采用基于时延估计的声源定位算法计算声源的方位角,并控制球机转向该方位角,实现了声源的实时定位和球机自动转向。实验结果表明该系统对单声源具有较高的定位精度,并且具有一定的应用价值。