论文部分内容阅读
语言交流在人类生活中的作用不言而喻,而听觉在语言交流中有着举足轻重的作用。一个有正常听觉的人甚至可以在很恶劣的环境下进行语言交流,而一个有听力障碍的人却要面临许多的困难。因而,人们一直在研究人类的听觉系统,希望可以帮助有听力障碍的人们。双耳声源定位是其中的一项关键技术,即研究人类辨别声源方位的机制。
双耳声源定位目前得到了广泛的研究和应用,该研究试图模拟人类的听觉系统,不仅在研究助听器方面,而且在听觉场景分析、自动语音识别系统、仿生机器人、增强现实音频和多声源分离及追踪等领域发挥了重要作用。
本文首先研究了室内环境下双耳声源定位系统的原理及实现,讨论了双耳听觉定位线索和与头相关传递函数(Head-Related Transfer FunctioN,HRTF)数据库匹配两部分。定位线索主要有耳间时间差(Interaural Time Difference,ITD)、耳间强度差(InterauralIntensity Difference,IID)及谱信息等,本文主要研究利用ITD进行声源定位。论文选择MIT实验室的HRTF数据库直接计算得到参考方位ITD,再由双耳声信号得到ITD估计值,最后进行匹配得到声源方位。
其次,本文研究了基于双耳信号模型的广义互相关ITD估计算法,讨论了影响算法性能的几个关键因素,最后提出了基于低通滤波的改进互相关算法,并通过实验进行了验证。同时为了提高系统在室内混响环境下的鲁棒性,本文重点分析了房间脉冲响应函数,并基于复倒谱最小相位分量低通滤波的去混响算法,提高双耳声定位算法对混响的鲁棒性,最后进行了实验验证。
最后本文对双耳声源定位系统进行了实际的系统测试。测试主要在消声室和普通房间内进行,并采用了多种声源如白噪声、音乐及语音信号等。测试结果表明,该系统抗混响性能较好,定位精度较高,达到了预期要求。