论文部分内容阅读
流形学习作为一种非线性维数约减技术已广泛应用于人脸识别、图形学等领域,是当前机器学习的研究热点之一。但是,流形学习的降维效果非常依赖于原始流形的分布,并且对噪声非常敏感,参数选择也较为不易。所以在实际应用中,提高流形学习方法的鲁棒性至关重要。基于此,本文重点研究了鲁棒流形学习方法在数据可视化与人脸识别中的应用。首先,简要介绍了流形学习方法的基本概念,将现有的流行学习方法归纳为全局特性保持和局部特性保持两类,并重点分析了等距映射(ISOMAP)和局部线性嵌入(LLE)这两种典型的流形学习算法。最后通过实验分析了主要流形学习算法的优缺点。其次,考虑到利用离群点因子进行离群点检测的问题,结合箱型图理论,给出了一种基于箱型图的离群点检测算法。再考虑到数据中的离群点对于海赛特征映射(HLLE)中邻域选择的影响,结合局部加权PCA的思想,引入性能评分的概念,从而给出了一种鲁棒海赛特征映射算法(RHLLE)。该算法能够检测出离群点并降低其影响,并能改善HLLE中每个样本局部切空间坐标的准确性。通过数据可视化实验,证明了RHLLE算法能有效将离群点与观测样本分离开,并准确反映出样本依各自由度上的分布情况。最后,由于RHLLE本质上是无监督流形学习方法,因此针对人脸识别问题,我们结合最大边距准则来引入类别信息,提出了鲁棒判别海赛特征映射算法(RDHLLE),从而使得该算法不但能够稳定地保持数据的结构特性,而且能够最大化类问样本的可分性。通过实验证明了RDHLLE算法无论是在标准人脸数据还是含有离群点的人脸数据库中都能取得良好的识别率,并能有效抑制人脸数据中的噪声。