论文部分内容阅读
随着3D游戏和家庭影院等数字多媒体的发展,消费者要求更加身临其境的聆听体验。沉浸式听音体验是使用回放设备对录制的音频内容进行空间音频再现的目标。为了实现高效的空间音频再现,受人类听觉系统的启发,声场被认为是前景声音(Primary,主声源)和背景声音(Ambient,环境声成分)的线性组合。由于人耳对主声源和环境声成分存在感知差异,通过对主声源和环境声成分分别使用不同的渲染方案,可以保留各个成分独有的空间特性,并实现沉浸式的空间音频再现效果。由于现有的基于声道的音频信号都是不同音频成分的线性组合,这就需要从混合信号中提取主声源和环境声,这个过程被称为主声源-环境声提取(Primary-Ambient Extraction,PAE)。准确的PAE算法,可以很好的提高再现空间音频的质量。本文着重研究多声道和多主声源的PAE算法,以期通过更准确的PAE算法来实现高效的空间音频再现。现有的PAE算法多是针对立体声信号的,而针对多声道信号的PAE算法不够完善。现有多声道PAE算法计算复杂度较高,以及空间性能较差等问题。为了得到更准确的多声道PAE算法,本文分析了现有的多声道PAE算法,并提出了基于最小二乘法的多声道PAE算法,解决了现有算法计算复杂度较高和空间性能较差的问题,使多声道PAE算法具有更优的提取性能。通过实验证明,本文提出的算法在空间精确性和计算复杂度上都明显优于现有的多声道PAE算法。通过研究现有的PAE算法,发现目前PAE算法的主要处理对象还是单一主声源的混合音频,而对于多主声源混合音频的研究,很少涉及。本文针对多主声源PAE算法的研究现状,介绍了传统基于PCA的多主声源PAE算法,并在传统方法的基础上引入一个量化主声源和环境声能量的参数,设置阈值对主声源的提取进行控制。实验证明,本文提出的方法在主声源的提取性能上明显优于传统算法,解决了传统PCA算法误差较高的问题,平均降低了 5dB的误差信号比。本文对多声道以及多主声源PAE算法进行了深入的研究和讨论,并在传统方法基础上做出了改进。其最主要的目的还是得到更准确的PAE算法,以通过更准确的PAE提取来实现沉浸式的空间音频再现听音体验。