论文部分内容阅读
近年来,随着信息社会化发展,说话人识别作为具有语音识别与理解功能的智能人机接口,是新一代计算机的重要组成部分。说话人识别系统出现在越来越多的电子产品上,尤其在信息安全和人机交互等方面,有着很好的应用前景。大多数说话人识别系统都是面向通用CPU设计的,而现今的嵌入式产品的出现,使用专用集成电路的设计成为必然选择。 说话人识别是通过对所收到的语音信号进行处理,提取相应的特征或建立相应的模型,然后据此做出判断。一个典型的说话人识别系统包括:语音信号获取、特征提取、说话人训练和识别(模式匹配)四个部分。本文的研究内容是一个说话人识别的加速器,目的在于提高说话人识别的实时响应能力、运行速度和系统性能,主要做了以下工作: 首先分析了典型说话人识别系统的各关键技术,详细分析了矢量量化技术在说话人识别中的应用,研究了码本训练算法以及说话人判别算法,对算法中各参数值的选取进行了讨论;其次根据系统的需求建立一个小的语音库,录制语音信号,并对采集的语音信号进行预处理,检测语音信号的起始端点;在MATLAB环境下仿真说话人识别系统,验证系统设计方案的可行性:特征提取阶段,提取语音信号的12阶美尔倒谱系数以及各阶倒谱系数对应的1阶差分倒谱系数,在训练阶段,采用分裂法和GLA算法相结合的矢量量化技术训练说话人的码本,识别阶段采用阈值判定的方法。仿真结果表明该识别算法可达较高的识别率。 设计说话人训练和识别(模式匹配)加速器:对特征参数进行转换,变浮点形式为定点形式,作为加速器设计和验证数据。设计说话人识别加速器,包括基于矢量量化的说话人码本训练模块和基于矢量量化的说话人判别模块,对各个模块的结构和设计方案进行了详细的分析。 最后本文设计了系统验证的方案,并对模块进行了仿真、验证和综合,同时对结果进行分析,提出改进的思想。