论文部分内容阅读
计算机视觉与模式识别技术是计算机科学和人工智能研究领域的重要分支,计算机视觉的目的在于研究人类视觉的计算模型,并利用机器来实现视觉专用系统。本文主要以人脸为研究对象,采用机器学习的方法,提出了一系列人脸检测、跟踪和识别的相关算法;同时,本文还研究了高维数据的非线性降维和角点检测问题。主要工作如下:(1) 人脸检测是人脸识别的前期工作。本文以简单的Haar特征结合阈值构造弱分类器,通过AdaBoost学习选择和集成弱分类器,最后按照分层结构把集成的分类器组合在一起;同时,在检测过程中采用积分图的方法计算特征,保证了检测的速度。(2) 基于主成分分析(PCA)的特征脸法是人脸识别中应用最广泛的方法之一。但是这种方法平均的对待每一维特征,无视不同特征在识别中所起作用的不同,这里提出了一种新的加权主成分分析算法。与传统主元分析不同,加权主元分析根据特征的分类能力进行加权,通过最小化加权重建误差来寻找加权子空间,并利用点到加权子空间的距离进行分类。加权系数可以通过计算每维特征类间方差与类内方差之比获得。实验表明,加权主元分析与传统主元分析相比可以大大提高识别率。(3) 本文还在人脸检测器的基础上,提出了一种置信度梯度寻优的人脸跟踪算法,并以DirectShow为平台实现了一个多人脸跟踪系统。当视频输入大小是320×280,每秒15帧;该系统可以平滑地在P4 1.4GHZ的计算机上运行。(4) 在分析和讨论LLE和Isomap这两种非线性降维方法的基础上,给出了一类基于保角变换的Isomap算法,实验表明这种方法可以在降维过程中很好的保持子空间的几何结构。针对LLE和Isomap本身无法提供对新的数据点投影变换的缺陷,提出了一种新的依据样本点局部关系的投影变换算法。(5) 角点检测一直是计算机视觉中基本而又困难的问题,本文提出了一种基于自适应直线拟合的角点检测算法,根据拟合误差自适应的选择拟合窗口的宽度,通过拟合直线估算曲率,进而得到角点位置。