论文部分内容阅读
人脸自动识别技术是模式识别和计算机视觉领域最富挑战性的研究课题之一,也是近来研究的一个热点问题,具有十分广泛的应用前景。虽然人类不需要任何训练准备即能识别出人脸,但人脸的机器自动识别却是一个难度极大的课题。 人脸自上而下自左至右的不同特征区域可以用嵌入式隐Markov模型(Embedded Hidden Markov Model,简记为E-HMM)的状态序列来表示。同一个人的脸像由于受到多种变化因素的影响而具有丰富的表现,可以把这些不同的影像看作是同一组状态序列产生的一系列表现,它们对应的是同一个E-HMM。不同的人用不同的E—HMM的来描述。E-HMM可以在模型层反映人脸二维方向的结构特征,能够较好地描述具体人脸的个人特征,基于E-HMM模型的人脸识别方法已经初步取得了较好的结果。 本文深入研究了基于E-HMM的人脸识别方法,进一步改进了经典的E-HMM参数重估算法,特别是将人工神经网络(Artificial Neural Network,简记为ANN)技术与E-HMM相结合,从而扩充和加强了基于E-HMM人脸识别的识别性能。本文做出了以下四个方面的贡献: (1)鉴于不同角度的照片包含面部特征信息量的不同,提出了一种加权合成的E-HMM模型参数重估算法。重估模型参数时,首先计算每幅脸像相对应的模型参数,然后进行加权合并,权值由迭代公式求得,训练结束后用一个合成的模型来表示一个对象。合并权值也可以称之为不同训练样本对最终合成的模型参数的影响因子,因此合成的E-HMM方法所得到的模型参数能够更好地反映不同训练样本的信息量,更好地提取出人脸图像空间结构和局部特征信息。 (2)针对嵌入式隐Markov模型再学习问题,提出一种增量式训练方法—模块化的训练算法。该方法对训练样本中不同训练样本集,都通过训练算法产生相应的模型参数模块,训练结束后对不同的模型参数模块合成,得到最终的模型。本方法的优点是使E-HMM参数估计过程具有良好的灵活性和易扩充性:对新增加的训练样本,产生的最后模型既保留了已经训练过的信息又能反映新增样本的信息,同时减少了计算量,而且可以把训练样本和模型参数分开,在模型库中只保留训练好的模型参数值和有关的中间值,不必保留训练样本。 (3)综合E-HMM和ANN的优点,提出了一种用于人脸识别的E-HMM/ANN混合识别网络。该混合识别网络用E-HMM的参数来描述人脸的整体性和局部细节性特征,用E-HMM的输出似然值序列组成ANN的输入矢量,利用ANN的鉴别训练能力来克服E-HMM的基于最大似然准则训练算法区分力较差的弱点,同时利用ANN的学习能力来提高E-HMM的识别性能。 (4)研究了 E-HMM和 ANN混合模型的建立及其训练问题。常规 E-HMM,其观察值概率密度函数往往假定为高斯概率密度函数,在本E-HMM/ANN混合模型中,用多个神经网络模块分别估计主HMM内嵌入的不同子HMM状态的观察值概率密度函数,使得E-HMM/ANN混合模型估计出的E-HMM中嵌入的子HMM状态对应的观察值输出概率具有辨别分类性质,对训练数据的统计分布也不必作假定。