基于双耳信息交互的声源定位技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:weishuren33
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双耳声源定位即通过放置在耳道入口或耳道内的传声器采集到的声信号估计声源方位。该项研究兴起于二十世纪八十年代,以心理声学和现代数字信号处理为基础,重点研究声信号中包含的空间方位信息以及听觉环境对声源定位的影响。由于人耳听觉系统的结构较为复杂,听觉生理过程和心理过程尚未全面了解,双耳声源定位的研究仍处于探索阶段,很多问题有待解决,例如听觉方位特征的提取与利用,噪声与混响对定位性能的影响,3D空间定位机制的实现等,对这些问题的研究需要不断深入完善。   本文首先概述了双耳声源定位的研究背景、发展过程和应用领域,并介绍了空间听觉的基本理论。通过对现有声源定位方法进行总结和比较,分析双耳声源定位的特点,引出空间听觉方位特征。研究表明,头相关传输函数(Head Related Transfer Function, HRTF)体现了声波传输过程中外耳、头部、躯干等生理结构对来自不同方向声信号的滤波作用,包含重要的方位信息,可以通过提取双通路声信号的方位特征与HRTF数据库进行匹配,获得声源位置的估计。   基于HRTF匹配模型,本文提出了一种采用耳间时间差(Interaural Time Difference, ITD)和耳间强度差(Interaural Intensity Difference, IID)特征联合判决的定位方法,主要通过以下改进提升定位性能:   (1)结合听觉系统特性对传统定位特征提取过程进行改进,双耳声信号首先通过类似人耳听觉滤波器的Gammatone滤波器组,进行频域子带划分后,再输入特征提取模块提取相应子带的定位信息,用于后续方位映射过程;   (2)建立子带定位特征统计模型,使用多帧信号耳间差的均值和方差作为特征值线索。定位时,分别计算采集信号的子带ITD、IID与各方位相应子带特征的似然度,并利用高斯混合模型整合子带信息,作为方位估计的判决量。   本文分别对由HRTF数据库生成的虚拟声以及消声室环境下的采集声进行了定位测试和性能分析,仿真结果表明,该定位算法对声源类型和噪声具有较强的鲁棒性,有效提高了声源定位系统的性能。  
其他文献
随着Internet的飞速发展,科研管理各机构陆续建立了科研管理系统,这些系统在建设时,缺乏统一的协调和规划,大都采用不同的技术平台、数据存储技术、数据结构,形成了大量的异
认知无线电网络中,认知用户在接入信道之前需要进行感知,然后通过感知结果决定是否接入信道。但是授权用户可以随时接入信道,如果选择被认知用户占用的信道,那么认知用户就要
变电站作为电力系统枢纽一旦发生大电流侵入变电站的事故,会导致站内电气设备损坏并且还可能造成电网大面积停电,影响我国正常的经济发展和人民稳定的生活。随着面向智能电网变电站的快速发展,将会有大量的测量、控制、无线传输和其他的二次设备投入到变电站中。所以,目前对雷电引起大电流的保护方法已经不能满足智能变电站对可靠性的要求。提高变电站对雷击引起大电流的保护可靠性已经成为一个急需解决的问题。变电站对雷击引起
近年来,通信技术迅猛发展,移动通信已经成为人们日常生活不可或缺的部分,发挥着重要的作用。伴随着互联网技术的不断发展和人们对高速手机数据业务需求的不断增加,单一的语音
OFDM (Orthogonal Frequency Division Multiplexing)技术以其多载波、抗多径干扰特性被选为LTE (Long Term Evolution)系统的关键技术。同时,OFDM技术能更好与链路自适应技
运动目标跟踪和网络监控是远程智能视频监控系统的关键技术和主要研究方向,其主要功能为主动监测监控场景中的运动物体,分析其运动轨迹,并将监控场景通过网络发送到监控端。
移动用户对通信数据率的需求与可用频率带宽受限的矛盾,随着用户数持续增长与多媒体业务迅速发展,日渐突出。为提高无线通信的可靠性与有效性,研究人员从时域、频域等维度对
随着嵌入式多媒体应用领域的发展,人们对多媒体播放器的功能要求越来越高,尤其是对不同多媒体格式的支持;大屏幕电视的普及,使影片的观看达到更好的视觉效果。而为满足大众个
近些年微带天线以其体积小,剖面低,易集成,造价低等特性以及良好的性能受到广泛的关注。随着移动通信系统业务的不断增加,通信设备不断向小型化发展,对天线体积、集成化及工