论文部分内容阅读
近年来,低速率语音编码技术发展迅速,出现了多种成功的编码算法,如多带激励编码器、混合激励线性预测编码器、正弦交换编码器和波形内插编码器等.而在2.4kb/s编码速率上,波形内插编码器在正式的测试中获得了几乎最好的评价,并且已经成为研究的热点。
本文选择了波形内插(WI-Waveform Interpolation)编码方案作为设计低速率语音编码器的模型,基于C语言高效、快速、灵活及便于移植等特性,本文使用C语言实现整个编码器,以G.729共轭结构一代数码激励线性预测(CS-ACELP-Conjugate Structure Algebraic Code Excited Linear Prediction)、自适应多速率(AMR-Adaptive Multi-Rate)等语音编码标准为设计参考,最终实现了高效的2.4kb/s波形内插语音编码器,具有较好的语音质量。
本文首先对波形编码技术的研究进展情况进行了简要介绍,并以W.B.Kleijn提出的特征波形内插(CWI-Characteristic Waveform Interpolation)编码器为模型,对编码器的原理和特点进行了深入的分析和研究。然后本文参考现有CWI编码模型,结合当前的编码技术,设计并实现了改进的2.4kb/s的CWI编码方案。为了便于进行数据分析和算法验证,编码器的设计将分析合成模块和量化模块层分开实现,并且每个功能模块的设计都在MATLAB中进行了仿真测试,给出了相应的仿真结果和图示说明.
对于2.4kb/s的波形内插编码器来说,重建语音的质量取决于参数的量化效果,而与编码模型几乎无关.由于线谱频率(LSF-Line Spectrum Frequency)参数、慢渐进波形(SEW-Slowly EvolvingWaveform)和快渐进波形(REW-Rapidly Evolving Waveform)的幅度谱,甚至特征波形的功率都要进行矢量量化,因此矢量量化器设计和码书的训练是本文研究的重点对象。本文在第4章给出了基于LBG算法的矢量量化器的设计,为了方便各种不同参数进行量化时调用,将整个码书训练的流程编写为通用的C语言库函数形式.在进行LSF参数和特征波形功率量化过程中,为了降低复杂度和减小存储空间,本文采用了分裂和分级的思想;由于SEW和REW幅度谱都是变维矢量,本文采用变维矢量量化(VDVQ-Variable Dimension Vector Quantization)方法将其转换为定维矢量,再进行码书训练或者使用矢量量化器进行编码。
本文在第5章给出了2.4kb/s的CWI编码器的分析测试和性能评价。由于编码比特存放在二进制文件中,因此本文给出了详细的编码比特的封装和拆封流程的设计,并对将编码前的参数索引值和解码生成的参数索引值进行比较,通过测试验证了比特封装和拆封的准确性。最后通过非正式的平均意见得分(MOS-Mean Opinion Score)测试、判断韵字测试(DRT-Diagnostic Rhyme Test)等主观测试方法对重建语音质量进行了主观评价,测试结果表明重建语音的质量可以达到通信质量,编码效果与2.4kb/s的混合激励线性预测(MELP-Mixed Excitation Linear Prediction)编码器相当。