论文部分内容阅读
随着因特网的迅猛发展,当今社会已经进入网络化和信息化时代,而想要准确并且高效的获取所需的数据,第一步就是对数据进行分类。迁移学习可以利用少量的有标签训练样本或者源领域数据,建立一个可靠的模型对目标领域数据进行预测(源领域数据和目标领域数据可以不具有相同的数据分布)。这放宽了传统的分类学习中对样本间分布的限制。另一方面,由于水下复杂环境的影响,以及声音信号传播的不确定性,水下声音信号处理和分类一直都是世界公认的难题。而传统的方法大多是利用纯数学的方法对声音信号处理并分类,这样往往无法得到让人满意的分类结果。近年来由于深度学习的不断发展,使用深度迁移网络对声音信号进行分类这一想法越来越具有可行性。本文对各种迁移学习方法进行研究分析和总结,利用现有方法的优点,以及针对其不足之处,提出了一种新的基于水下声音特征分析的迁移学习方法。在数据特征处理上,本文针对水下声音信号的非平稳性,提出一种适用于水下非平稳信号的时频信号分析方法NSST(Non-Stationary Signal Transform,NSST),将声音信号转化为二维的光谱图,然后利用MFCC特征提取方法通过倒谱分布得到相应的MFCC系数,并以此作为接下来进行迁移学习模型训练的数据。在迁移学习方面,本文利用一个孪生神经网络,利用网络的卷积层去分别提取源域和目标域数据集的特征,同时在损失函数中加入L2范数去防止因全连接层增多而导致的模型出现过拟合现象。传统的迁移学习方法,或只考虑数据集之间的分布差异,或只考虑领域间的不变性,本文考虑到二者实现的功能相似,所以创新的将二者结合,提出一种新的迁移学习方法DFA(Data Feature Analysis,DFA),既使用改进的最大平均差异(Maximum Mean Discrepancy,MMD)算法去匹配两数据集间的分布差异;又利用梯度反转方法去阻止域分类器在误差反向传播阶段的梯度下降,保持域间的领域不变性。并提出了一种参数动态调整方法,以动态的调整两种方法在模型进行迭代训练过程中的重要程度。得到训练好的迁移学习模型后,本文创新的将其应用于水下声音信号的识别与分类。最后,利用实验对本文提出的时频信号分析方法NSST和迁移学习方法DFA进行验证,实验结果证明了本文提出的基于水下声音信号分析的迁移学习方法达到了理想的效果。