论文部分内容阅读
近年来随着通信技术及数字信号处理技术的飞速发展,语音端点检测用于区别语音和噪声,在语音处理系统中具有重要意义。本文首先介绍了各种典型的语音端点检测算法,通过理论分析及模拟仿真,对它们的优缺点进行了总结。然后,对其中的两种算法进行了改进,使它们能够适应于更广的环境。最后,在基于增强型单片机STM32的硬件电路上,对改进的谱熵算法进行了验证。主要研究成果如下:(1)在分析了典型算法的基础上,对常规谱熵算法和短时平均幅度差算法分别进行了改进:其一,结合语音的短时能量算法,对常规谱熵算法进行改进,形成了一个新的特征参数--谱熵能量积。仿真结果显示,改进的算法弥补了常规谱熵算法在低噪声环境下检测效果不理想的缺陷,在非平稳噪声环境下检测精度也有了一定的提高,稳定性得到增强。其二,为了将语音和冲击噪声进行准确地区分,结合语音浊音信号的周期性以及短时平均幅度差这一时域特征参数,对语音和汽车冲击噪声进行了分析,并在此基础上对算法进行改进,提出了一新的检测参数--短时平均幅度差峰值数。仿真结果显示,新参数能够在低噪声环境下区分出语音和冲击噪声。(2)设计了一个用于验证谱熵改进算法的语音端点检测电路。该电路以增强型单片机STM32F103RB为主体,结合语音录音模块ISD1760,通过程序的编写和控制,实现了语音信号的录制、AD转换、语音信号的端点检测处理以及LCD的显示。主要的实现过程为:单片机通过SPI通信控制语音芯片的录音存储,将语音信号AD转换后,对处理后的语音数据进行端点检测,同时,将检测到的语音段和噪声段分别用不同的颜色在LCD上显示,经过判断将真正的语音信号进行存储。