论文部分内容阅读
随着计算机网络的飞速发展,多媒体数据越来越多地出现在互联网上,多媒体信息的无序使得用户在其搜索和管理上都很不方便。快速便捷地进行多媒体信息的检索、查询和浏览,成了人们的迫切愿望。如何提取一些有效的、好的音频特征成为基于内容音频检索的首要任务。
音频的特征提取是音频分类的基础,好的特征集能提高分类的准确度。本文用小波滤波法和改进的互相关函数法来提取音频信号的基音周期特征;另外,用极相连算法来提取音频共振峰特征。本文主要内容如下:(1)提取基音周期的互相关函数之前用多尺度连续小波变换来预处理数字语音信号,小波把语音信号分解成高维向量,增强了声门短时锐变信息,再经过中心消波,并用短时平均幅度差函数和自相关函数法相结合的算法来提取基音周期,即是本文给出的互相关函数法;(2)音频轮廓的极高点和极低点用修正的共振峰极相连估计算法:极点交叉(相连)来描述,并对结果进行协方差处理;(3)对纯音乐和语音的分类特征主要用平均过零率来区别,从而用更少的维数来准确地描述音频,当音频例子增加的时候,时延增长较少;(4)整个特征提取过程不再沿用传统的节点区分度量值,而是采用了目前新的,比较流行的节点分帧统计特征。
实验采用SVM作分类器来验证基音周期和共振峰这两类特征的优良性,并且对纯语音、带噪声的语音、纯音乐这三类音频进行识别分类。实验结果显示分类识别取得了较高的准确度,而且在音频例子增加的情况下时延较小。