论文部分内容阅读
双耳声源定位即通过放置在耳道入口或耳道内的传声器采集到的声信号估计声源方位。该项研究兴起于二十世纪八十年代,以心理声学和现代数字信号处理为基础,重点研究声信号中包含的空间方位信息以及听觉环境对声源定位的影响。由于人耳听觉系统的结构较为复杂,听觉生理过程和心理过程尚未全面了解,双耳声源定位的研究仍处于探索阶段,很多问题有待解决,例如听觉方位特征的提取与利用,噪声与混响对定位性能的影响,3D空间定位机制的实现等,对这些问题的研究需要不断深入完善。
本文首先概述了双耳声源定位的研究背景、发展过程和应用领域,并介绍了空间听觉的基本理论。通过对现有声源定位方法进行总结和比较,分析双耳声源定位的特点,引出空间听觉方位特征。研究表明,头相关传输函数(Head Related Transfer Function, HRTF)体现了声波传输过程中外耳、头部、躯干等生理结构对来自不同方向声信号的滤波作用,包含重要的方位信息,可以通过提取双通路声信号的方位特征与HRTF数据库进行匹配,获得声源位置的估计。
基于HRTF匹配模型,本文提出了一种采用耳间时间差(Interaural Time Difference, ITD)和耳间强度差(Interaural Intensity Difference, IID)特征联合判决的定位方法,主要通过以下改进提升定位性能:
(1)结合听觉系统特性对传统定位特征提取过程进行改进,双耳声信号首先通过类似人耳听觉滤波器的Gammatone滤波器组,进行频域子带划分后,再输入特征提取模块提取相应子带的定位信息,用于后续方位映射过程;
(2)建立子带定位特征统计模型,使用多帧信号耳间差的均值和方差作为特征值线索。定位时,分别计算采集信号的子带ITD、IID与各方位相应子带特征的似然度,并利用高斯混合模型整合子带信息,作为方位估计的判决量。
本文分别对由HRTF数据库生成的虚拟声以及消声室环境下的采集声进行了定位测试和性能分析,仿真结果表明,该定位算法对声源类型和噪声具有较强的鲁棒性,有效提高了声源定位系统的性能。