嵌入式隐Markov模型和神经网络人脸识别

来源 :大连理工大学 | 被引量 : 31次 | 上传用户:polaris20092009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸自动识别技术是模式识别和计算机视觉领域最富挑战性的研究课题之一,也是近来研究的一个热点问题,具有十分广泛的应用前景。虽然人类不需要任何训练准备即能识别出人脸,但人脸的机器自动识别却是一个难度极大的课题。 人脸自上而下自左至右的不同特征区域可以用嵌入式隐Markov模型(Embedded Hidden Markov Model,简记为E-HMM)的状态序列来表示。同一个人的脸像由于受到多种变化因素的影响而具有丰富的表现,可以把这些不同的影像看作是同一组状态序列产生的一系列表现,它们对应的是同一个E-HMM。不同的人用不同的E—HMM的来描述。E-HMM可以在模型层反映人脸二维方向的结构特征,能够较好地描述具体人脸的个人特征,基于E-HMM模型的人脸识别方法已经初步取得了较好的结果。 本文深入研究了基于E-HMM的人脸识别方法,进一步改进了经典的E-HMM参数重估算法,特别是将人工神经网络(Artificial Neural Network,简记为ANN)技术与E-HMM相结合,从而扩充和加强了基于E-HMM人脸识别的识别性能。本文做出了以下四个方面的贡献: (1)鉴于不同角度的照片包含面部特征信息量的不同,提出了一种加权合成的E-HMM模型参数重估算法。重估模型参数时,首先计算每幅脸像相对应的模型参数,然后进行加权合并,权值由迭代公式求得,训练结束后用一个合成的模型来表示一个对象。合并权值也可以称之为不同训练样本对最终合成的模型参数的影响因子,因此合成的E-HMM方法所得到的模型参数能够更好地反映不同训练样本的信息量,更好地提取出人脸图像空间结构和局部特征信息。 (2)针对嵌入式隐Markov模型再学习问题,提出一种增量式训练方法—模块化的训练算法。该方法对训练样本中不同训练样本集,都通过训练算法产生相应的模型参数模块,训练结束后对不同的模型参数模块合成,得到最终的模型。本方法的优点是使E-HMM参数估计过程具有良好的灵活性和易扩充性:对新增加的训练样本,产生的最后模型既保留了已经训练过的信息又能反映新增样本的信息,同时减少了计算量,而且可以把训练样本和模型参数分开,在模型库中只保留训练好的模型参数值和有关的中间值,不必保留训练样本。 (3)综合E-HMM和ANN的优点,提出了一种用于人脸识别的E-HMM/ANN混合识别网络。该混合识别网络用E-HMM的参数来描述人脸的整体性和局部细节性特征,用E-HMM的输出似然值序列组成ANN的输入矢量,利用ANN的鉴别训练能力来克服E-HMM的基于最大似然准则训练算法区分力较差的弱点,同时利用ANN的学习能力来提高E-HMM的识别性能。 (4)研究了 E-HMM和 ANN混合模型的建立及其训练问题。常规 E-HMM,其观察值概率密度函数往往假定为高斯概率密度函数,在本E-HMM/ANN混合模型中,用多个神经网络模块分别估计主HMM内嵌入的不同子HMM状态的观察值概率密度函数,使得E-HMM/ANN混合模型估计出的E-HMM中嵌入的子HMM状态对应的观察值输出概率具有辨别分类性质,对训练数据的统计分布也不必作假定。
其他文献
目的分析急危重症口腔颌面部感染患者的临床特点,为提高治疗效果提供依据。方法选取2015年1月至2016年12月首都医科大学附属北京友谊医院口腔科与重症医学科联合诊治的急危重
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
期刊
住房租赁市场,是房地产市场的重要组成部分,也是解决住房问题的重要渠道。国务院《关于加快培育发展住房租赁市场的若干意见》提出“发展住房租赁企业”,充分发挥市场作用,调动企
反求工程是针对已有产品原型,消化、吸收和挖掘蕴含在其中的涉及产品设计、制造和管理等各个方面的原理和知识的一系列分析方法、手段和技术的综合。近年来,随着特征技术的引入
孟子,战国时期著名的政治家、思想家、教育家,所著《孟子》一书为其教育理论的基本思想源泉。孟子在教学目的上提倡人性化,主张教学内容更丰富,在教学方法上强调多样化。这对
近年来随着计算机硬件性能的不断提高,嵌入式系统中软件系统的规模和复杂性不断增加,从而软件对整个系统的影响逐渐占据了统治地位,嵌入式软件已成为近几年来人们研究的热点
协同设计系统是计算机支持的协同工作(CSCW)在工程设计领域的应用,也是网络环境下工程设计自动化的关键技术和研究热点。近几年来我国在协同设计领域进行过大量研究,取得了不少
本文主要研究了基于计算机视觉技术的视频智能监控系统中的关键技术,该系统一般由人体目标的检测、行为理解和高层语义输出三个层次,其中人体目标的检测是后面两个模块的基础