论文部分内容阅读
特征提取是模式识别中的一个关键步骤。提取包含丰富判别信息的特征对于模式识别系统来说,具有非常重要的意义。而且,近年来,随着生物特征识别技术和相关应用的发展,对特征提取算法又提出了更高的要求。目前,广泛使用的特征提取算法是基于统计理论的一类算法,比如主成分分析和线性判别分析。尽管这些方法在实际应用中取得了不错的效果,但是仍然存在一些问题有待进一步研究和解决。本文针对其中的(1)小样本问题,(2)特征空间的维数确定问题,以及(3)适用于高维数据的特征提取算法等进行了研究。基于遗传算法,本文提出了一系列新的特征提取算法。把这类算法统一称为进化特征提取算法。它们较好的解决了上述问题,并且做出了一些有益的探索。本文的主要贡献包括以下几个方面:(1)同时从降低原始数据维数和修改线性判别分析的求解过程两个角度出发解决小样本问题。利用核主成分分析作为数据预降维方法,并利用遗传算法迭代搜索最优判别矢量,本文给出了一种新的基于遗传算法的KPCA+LDA 算法。(2)提出了通过线性组合原始空间的基向量生成投影基向量的方法。基于这种方法,结合线性判别分析准则,本文给出了一种具体的基于向量线性组合的进化特征提取算法(LDA-LCEFE)。(3)基于支持向量机的最大化分类空隙的思想,本文提出了一种新的评价特征空间的方法。据此,我们还给出了一种具体的计算方法,得到了一种新的进化特征提取算法(SVM-LCEFE)。(4)通过在遗传算法的适应度函数中引入关于特征空间维数的惩罚因子项,本文提出了一种基于遗传优化机制确定特征空间维数的方法。它能够在分类性能和特征空间维数之间达成一个较好的平衡。(5)结合向量线性组合和正交补技术,本文提出了一种能大大降低现有进化特征提取算法的空间复杂性的算法。该算法能够直接适用于较高维的数据,而不需要使用PCA 或WPCA 等对数据进行预降维。(6)本文研究了改进进化特征提取算法效率的问题,提出了包括基于边界子集评价投影基向量的训练性能,利用线性判别分析解空间的理论分析结果来约束遗传算法的搜索空间等方法,并从理论上分析或证明了这些方法。本文在JAFFE 数据库上进行了人脸表情识别实验,在Yale,ORL,以及FERET 数据库上进行了人脸识别实验。这些实验将本文提出的算法与现有的基于Gabor 小波编码的人脸表情识别算法,Eigenfaces,Fisherfaces,以及Evolutionary Pursuit 等人脸识别算法进行了对照,最终的结果证明了本文提出的算法能够较好地解决之前提出的那些问题,获得了较好的识别效果。