论文部分内容阅读
模式识别是近年来的热点问题之一。模式识别一般分为五个步骤:数据的获取,预处理,特征提取,特征选择以及分类器分类。特征提取和特征选择是分类问题的两个关键步骤,主要用于快速准确的分类。良好的特征提取方法所提取出的特征对后续的特征选择以及分类器的分类及模式识别起到很重要的作用。现有的特征提取方法有很多,但是特征提取过程与后续的特征选择过程往往是互相独立的,他们各自有各自的优化准则,然而两者优化准则的交集却未必准确。本文通过对现有的特征提取算法的研究学习,针对如何找到一种特征提取与特征选择进行联合学习的方法进行了研究,对现有的特征提取算法进行了改进。主要贡献包括:研究了一种非监督的联合稀疏邻域保持嵌入方法(Joint Sparse NeighborhoodPreserving Embedding, JSNPE),该方法的研究目的是希望降维后的数据既能够保持原始数据邻域的流形结构的信息,又能够使转换矩阵具有列稀疏性,以此来减少样本识别时的计算量,同时希望可以降低数据的维度,以达到较好的特征提取结果,为后续的分类器设计奠定良好的基础。本文还进一步研究了该联合学习算法的一种监督学习模型,称为联合判别稀疏邻域保持嵌入方法(Joint Discriminate Sparse Neighborhood PreservingEmbedding,JDSNPE)。通过对JSNPE中加入判别信息,能够有效的利用样本的类别的信息,即希望类间散度与类内散度的差值最大化,以达到同类聚集,异类分散的效果;而在此同时希望变换后的数据能够保持原始数据邻域的流形结构信息,并且使转换矩阵获得列稀疏性,以达到较好的特征提取的结果,为后续的分类器设计提供良好的输入结果。