论文部分内容阅读
随着多媒体技术和通信技术的发展,语音信号处理作为其基本内容,已经广泛应用于各个领域,随着技术的不断发展,所处理的信号的动态范围越来越大,而在实际使用中,由于背景噪声的影响,产生了许多不必要的处理时间,降低了语音处理的精度。因此各种不同的语音端点检测算法开始应用于各种语音处理系统中。在时域上将语音和噪声分离出来,称为语音端点检测(VAD)。如今,在语音信号预处理技术中,语音端点检测有着非常广泛的应用范围。在通信系统、语音编码、语音识别、语音增强、回声抵消等处理中是不可或缺的重要环节。早期的算法有基于短时能量和过零率,倒谱距离,基音检测等。但是这些方法在低信噪比的条件下,性能均出现不同程度的下降。本文总结了现有的典型语音端点检测算法,深入分析了各算法的基本原理,比较其优缺点,并给出了仿真结果。在此基础上,分析了现有语音信号的结构特点和特征参数,提出了在较强背景噪声环境下的两种语音端点检测新算法。分别是基于多子带熵的语音端点检测算法和基于Gaussian-Gamma模型的语音端点检测算法。并给出了仿真结果。从仿真结果可以看出在常见的噪声环境下,算法鲁棒性较好,在较低的信噪比下仍能比较准确地检测到语音信号的端点。论文对算法如何在硬件上的实现,进行了深入研究,该算法的硬件处理平台是以TI的TMS320DM642高性能DSP芯片为核心,TLVAIC23B作为语音输入输出芯片。设计了语音端点检测的软硬件系统,总结和提出了优化C语言编写算法代码的一些方法,实验表明,这些方法极大地提高了程序的运行效率。通过matlab仿真和硬件实现的结果表明,该算法可行性较高,环境适应性较强。文章最后对本文做出了总结。提出了一些在今后工作中需要改进的问题,并对近几年来的一些新的研究趋势做了简单的介绍和展望,指出了端点检测未来的发展前景。