室内环境下的双耳声源定位系统的研究与实现

来源 :东南大学 | 被引量 : 0次 | 上传用户:shenghuocc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语言交流在人类生活中的作用不言而喻,而听觉在语言交流中有着举足轻重的作用。一个有正常听觉的人甚至可以在很恶劣的环境下进行语言交流,而一个有听力障碍的人却要面临许多的困难。因而,人们一直在研究人类的听觉系统,希望可以帮助有听力障碍的人们。双耳声源定位是其中的一项关键技术,即研究人类辨别声源方位的机制。   双耳声源定位目前得到了广泛的研究和应用,该研究试图模拟人类的听觉系统,不仅在研究助听器方面,而且在听觉场景分析、自动语音识别系统、仿生机器人、增强现实音频和多声源分离及追踪等领域发挥了重要作用。   本文首先研究了室内环境下双耳声源定位系统的原理及实现,讨论了双耳听觉定位线索和与头相关传递函数(Head-Related Transfer FunctioN,HRTF)数据库匹配两部分。定位线索主要有耳间时间差(Interaural Time Difference,ITD)、耳间强度差(InterauralIntensity Difference,IID)及谱信息等,本文主要研究利用ITD进行声源定位。论文选择MIT实验室的HRTF数据库直接计算得到参考方位ITD,再由双耳声信号得到ITD估计值,最后进行匹配得到声源方位。   其次,本文研究了基于双耳信号模型的广义互相关ITD估计算法,讨论了影响算法性能的几个关键因素,最后提出了基于低通滤波的改进互相关算法,并通过实验进行了验证。同时为了提高系统在室内混响环境下的鲁棒性,本文重点分析了房间脉冲响应函数,并基于复倒谱最小相位分量低通滤波的去混响算法,提高双耳声定位算法对混响的鲁棒性,最后进行了实验验证。   最后本文对双耳声源定位系统进行了实际的系统测试。测试主要在消声室和普通房间内进行,并采用了多种声源如白噪声、音乐及语音信号等。测试结果表明,该系统抗混响性能较好,定位精度较高,达到了预期要求。
其他文献
随着科技的不断发展,各式各样的多媒体技术在计算机网络和日常生活中得到了广泛的应用。其中,JPEG静态图像压缩标准以其良好的压缩性能在图像处理领域获得了广泛的应用。通过
H.264/AVC是由国际电信联盟(ITU-T)和国际标准化组织(ISO)共同制定的新一代低码率视频压缩编码标准,具有高压缩比、高图像质量、良好的网络适应性等优点,在数字电视广播、视
近年来,垃圾邮件的泛滥严重影响了人们的网络交流和生活,其中图像型垃圾邮件在整个垃圾邮件中所占比重日趋加大。为遏止图像型垃圾邮件的泛滥,研究人员提出了基于不同特征集
通过对现今数字信号处理器综合系统需求的分析,并结合漏水信号处理的实际需要,本文设计并实现了基于DSP+CPLD体系结构的多功能DSP实验平台。该实验平台硬件设计采用模块化思
随着网络的不断发展和普及,远程教育已逐渐成为一种教学的辅助形式。但是,由于传统的远程教育存在互动性差、师生之间的交互能力弱的特点,本论文设计开发了具有实时交互功能
低密度校验(LDPC)码是一种基于双向图和迭代译码技术的信道编码方案,具有逼近Shannon限的优良性能,是目前信道编码领域研究的热点之一。本文对低密度校验码的原理、编译码技术进
随着人类对海洋资源的勘探利用和国防事业的日益需要,水下通信网络成为各国研究的重点。水下通信网络需由电池供电且长时间处于无人值守状态,所以作为节点中核心部分的低功耗
微电子技术、计算机技术和无线通信等技术的进步,推动了低功耗多功能传感器的快速发展,使其在微小体积内能够集成信息采集、数据处理和无线通信等多种功能。无线传感器网络就是