论文部分内容阅读
目前,不同的网络往往采用不同的语音编码标准,因此在两个异质网络之间进行语音通信时,需要将一种语音编码格式转换为另一种语音编码格式,即进行语音编码转换。传统的语音编码转换采用Tandem方式,即先解码再编码,这种转码方法具有计算复杂度高、语音质量下降、时延大等缺点。为了克服上述缺点,有必要研究更有效的语音编码转换算法,以降低转码计算复杂度和时延,提高转码语音质量,增加系统网络容量,降低通信成本。
本文研究AMR和G.729两种语音编码之间的转换。AMR是应用于无线网络的语音编码标准,它有8种速率模式;G.729是应用于因特网的语音编码标准,它仅有1种速率模式。它们都采用码激励线性预测技术,具有相似的编码参数。
在对码激励线性预测模型、AMR编码标准和G.729编码标准深入理解的基础上,分析已有的参数直接转换方法的利弊。根据语音转码的作用域不同,将AMR与G.729之间的语音编码转换方法分为如下五类:Tandem转码、语音域转码、激励域转码、参数域转码、索引域转码。参数域转码是已有的对参数进行直接转换的方法,索引域转码是针对具有相同固定码本结构的语音编码标准之间的转换,而语音域转码和激励域转码则是针对具有不同固定码本结构的语音编码标准之间的转换。目前,针对基于码激励线性预测模型的语音编码标准之间的参数域转码,已进行了大量研究,并提出多种采用参数直接转换的智能转码方式。但是这种参数转码方法仅对有相同固定码本结构的语音编码标准的转换有效,对具有不同固定码本结构的语音编码标准进行转换,不能得到满意的效果,要么是转码语音质量降低很多,要么是转码计算复杂度仍然很高。
针对Tandem转码和参数域转码的固有缺点,本文提出三种全新的转码方式,即语音域转码、激励域转码和索引域转码。实现了上述三种新的语音编码转换方式,进行了相关性能测试,并设计了转码语音通信系统。测试表明,索引域转码的计算复杂度大约为Tandem转码的6%~9%,并且提供比Tandem转码更好的语音质量;语音域转码的计算复杂度是Tandem转码的一半左右,其转码语音质量好于或接近于Tandem转码的语音质量;激励域转码的计算复杂度是Tandem转码的16%左右,其转码语音质量要略低于语音域转码语音质量,其PESQ得分仅比语音域转码低0.3左右。上述三种转码方法的性能都优于参数域转码。