论文部分内容阅读
语音识别作为语音信号处理的一个研究方向,不断得到发展。由于语音识别的飞速发展,语种识别作为语音识别的一个方面越来越受到人们的关注。语种识别是在与说话人、文本无关的基础上进行,对于语音信号中个体发音的差异需要尽量消除,才能有效提取不同语种的各种的语音特征参数,从而提高语种的识别率。本文使用支持向量机作为分类器,分别设计并实现了单特征单分类器和多特征单分类器语种识别系统,对来自“中国少数民族语电话语音”数据库的汉语、纳西语、白语、苗语和藏语等5种语言进行语种识别实验研究。从民族语语音特征方面进行分析,找出不同语种之间的差异,提取语种语音声学特征参数,选择不同的特征参数集作为SVM分类器的输入,再对得到的语音样本特征参数集分别进行循环训练和测试,最终得到识别结果。分别按男声、女声给出3种单特征参数、1种特征参数组合进行实验,并对实验结果进行了分析。实验结果表明:对于采用不同的声学特征集中,对于单个特征来说,基音频率的识别率最好,这是因为基音频率反映了激励源的信息;而对不同的语种来说,在语种识别中声调、语调起重要作用,因此识别率是最高的。实验中,使用多种特征的融合比任意单个特征识别率都高,这是因为语种识别中,语言有许多不确定的因素,目前还没有哪种语音特征能完全区别一种语言,因此多特征的融合使得分类中存在的差异信息更多,更容易达到识别的效果。