论文部分内容阅读
立体声编码可以将立体声音频信号压缩,使其所占存储空间与带宽降低,以便高效地存储和传输。与传统的立体声编码技术相比,参数立体声编码可以在不降低音质的前提下,获得更高的编码增益。参数立体声编码的理论基础是空间听觉,编码时将原立体声信号用单声道信号和空间参数来表达,解码时再进行相反的操作。还原声场中声音的基本信息由单声道信号反映,各个声像的位置和尺寸等信息则由空间参数控制,因此参数的选取在参数立体声编码技术占有重要的地位。本文通过对空间听觉理论的系统研究,分析得出合适的空间参数,并以此为依据建立参数立体声编码模型。从当前的空间听觉研究成果来看,本文所建模型涵盖了所有可用的空间参数,其他所谓的新参数本质上均可由所列参数衍生得到。目前已有的参数立体声编码技术,均符合本文所建模型。在给出编码模型后,本文研究了模型的实现,详细地介绍了编解码的具体细节。在剖析了典型参数立体声编码的基础上,本文探索了可能的改进方法,提出一种码流分层结构,采用这一结构可以得到变速率的编码算法。针对现有参数立体声存在的问题,本文提出了几个新的空间参数,并根据这些参数设计了基于FFT的编解码方案。最后对这一方案进行MUSHRA评分,测试结果表明,该方案和aacPlus v2中的参数立体声性能相当,但在左右声道相关性较小时,本文方案所得分值明显较高。需要指出,本文所研究的参数立体声编码,实际上并不局限于声道数为2的情况,可以推广为多声道音频编码。