论文部分内容阅读
人工神经网络是采用大量的处理单元连接起来构成的一种复杂的信息处理网络。这种网络具有与人脑相类似的学习记忆能力和输入信息特征抽取能力。人工神经网络是聪明的,因为它是通过实例学习。神经网络因其非线性、自适应及学习特性而受到极大关注,神经网络在诸多领域都取得成功的应用,如模式识别与图像处理、控制与优化、预测、通信等。 语音信号的产生本质上是一个非平稳和非线性的过程,但一直以来,传统的语音处理方法都采用一种线性预测方法来处理。本文针对传统方法的不足,在语音编码系统的自适应增益预测中引入神经网络模型,研究了基于神经网络的语音编码系统的增益非线性预测结构和学习算法,并将之应用于G.728语音编码算法。 本文研究了BP网络,实现了“梯度下降法”的网络训练方法,获得了较传统方法好的效果。另外又研究了RBF网络,实现一种叫“正交最小二乘法”的网络训练方法,获得较BP网络快20倍的训练速度,同时语音质量略有提高。为具体实现神经网络程序,本文采用了基于VC++和MATLAB的实现方法。实验结果表明:采用BP网络的语音编码系统的语句平均分段SNR比ITUG.728标准算法提高2dB左右,增益平均分段SNR提高3dB;同样地,采用RBF网络的语音编码系统的语句和增益平均分段SNR比ITU G.728标准算法分别提高2dB和3.1dB。 最后我们以提高的信噪比为代价分别进行了综合滤波器的降阶实验,结果表明:使用神经网络的算法当阶数降为10阶后仍然比原算法20阶的SNR要高;同时,降阶后算法的计算量大大降低,分析表明,改进后的算法能使G,728算法的总计算量降低40%,同时保持音质不变。