论文部分内容阅读
语音识别技术是语言学和数字处理相结合的一项技术,是一项复杂的工程,一门比较前沿的学科。由于语音系统的复杂性、外界噪声的干扰、语音信号的非平稳性、较差的适应性和汉语自身的特点等一系列问题,使语音系统在实现的过程中有很多困难。
本课题对语音识别系统的算法和车载语音识别系统的软硬件环境做了细致的研究,主要内容有:
(1)针对现有语音识别系统的算法,分别讨论了语音识别系统的采集、预处理、端点检测、特征参数提取和模式匹配等几种常见算法,并且根据本课题系统的要求,选择适合的参数和算法建立语音识别系统。
(2)对传统的端点检测算法:短时平均过零率和短时平均能量做了细致的研究。根据它们存在的问题,提出了对算法的改进研究。改进后的这两种算法对纯净语音信号和高信噪比环境下均能完成端点检测,但在低信噪比环境下失效。通过分析这两种算法的特点,改进并确定短时加权过零率和短时幅度相结合的检测算法作为本系统的端点检测算法。实验结果和数据表明,改进后的端点检测算法在纯净语音信号和低或高信噪比的环境下均可以完成端点检测,有效提高了系统的抗噪能力和识别率。
(3)对模式匹配中各种算法的优缺点和参数做了详细的分析。选用动态时间规整(DynamicTimeWarping)作为本系统的模式识别算法,并针对传统DTW算法存在的问题,改进了整体路径的约束和松弛起始点终止点的对齐方式。实验结果和数据表明,改进后的DTW算法有效提高了系统的运行速率。
(4)为了满足车载的要求以及实时性,本系统以ARM9系列的S3C2440为嵌入式处理器,以Linux为嵌入式操作系统,以Qt为嵌入式可视化操作界面,建立语音识别系统的软硬件环境,包括晶振电路、复位电路、电源电路、FLASH电路、SDRAM电路、音频电路、LCD电路和其它一些电路的设计,以及BootLoader、Linux内核、驱动程序、文件系统、Qt4的移植。
根据实验结果和数据分析得出结论:改进后的端点检测算法提高了系统的抗噪能力和识别率;改进后的DTW算法在识别率基本不变的前提下,系统的运行速率平均提高了20%左右;本课题车载语音识别系统在对纯净语音信号的识别率为90%左右,在大噪声时的识别率为80%左右,满足实时性和实用性的要求。