论文部分内容阅读
随着技术发展,在大数据的时代,信息处理已经融入了人们的生活,如何快速处理庞大的数据是我们急需面对的问题,特征提取就是针对海量数据的处理所提出的有效解决办法。很多的学者已经对特征提取展开了广泛且深入的研究,这些研究都具有着重要的实际价值,并且也存在着许多的挑战。对现有的特征提取算法的研究现状给出了介绍后,本文围绕主成分分析算法(PCA)展开,研究了具有良好鲁棒性的L21PCA算法。传统的机器学习算法中常用L2范数作为衡量样本距离的度量方式,而采用L21范数的优势在于既保留了和L2范数一样的旋转不变性,而且还具备了良好的鲁棒性,使得算法对输入样本的偏差值不敏感。基于这样的思路,在其它算法中将其推广,研究了以下几方面的内容:针对2DPCA算法,研究了改进的基于Frobenius范数的2DPCA。在二维主成分分析法(2DPCA)中提出了新的目标函数,引入了一个一般化优化问题的解法,将其应用于新的目标函数的求解过程中,得到了一个迭代算法求解基于Frobenius范数的2DPCA。该算法直接基于图像矩阵进行运算,相比L21PCA,无需将图像矩阵向量化处理,因此降低了计算量,提升了算法的运行速度,并且还具有良好的鲁棒性,然后通过在几个常用的图像库中实现该算法并且验证了算法的有效性。针对GPCA算法,研究了改进的基于Frobenius范数的GPCA。在广义主成分分析算法(GPCA)中利用类似的处理,调整了优化问题中的目标函数,去除了目标函数中Frobenius范数之后的平方,使得算法对于样本中存在的偏差值不敏感,从而具备良好的鲁棒性。该算法中调用了前面的基于Frobenius范数的2DPCA算法,相比GPCA算法改变了判定收敛的条件,通过详细的理论推导进行了说明了判定条件的选取。在常用的几个人脸库ORL,YALE和FERET中和GPCA算法做了对比实验,结合了最近分类器,选择欧氏距离作为衡量样本距离的度量方式,该算法得到了更好的识别结果。基于一种核化框架,研究了核化的L21PCA。结合了核函数的方法,引入了一种学习算法通用的框架,只需要算法满足某些特定的条件,就可以直接套用这个框架得到学习算法的核化方法,并从理论上给出了解释。结合前面的L21PCA算法,首先将输入数据使用满秩KPCA预处理,将得到的数据作为L21PCA算法的输入,再使用最近邻分类器对测试样本进行分类识别,实验验证了核化方法的可行性。