基于卷积神经网络的人脸表情识别研究

被引量 : 0次 | 上传用户:cshan225500
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于人机交互研究的不断深入以及巨大的应用前景,对人脸面部表情进行识别和分析已成为计算机视觉中非常重要、活跃和流行的课题。在过去几年中,深度学习在许多应用领域均取得了突破性成果,包括语音识别、图像理解、自然语言处理等。与传统方法用人工提取图像的几何、纹理特征不同,本文使用深度学习的卷积神经网络方法自动提取人脸图像特征,对人脸表情识别问题进行了研究,具体研究内容包括以下几点:1.尽管卷积神经网络已经被用于许多计算机视觉任务并表现出色,但是现有的网络结构对全连接层的关注却很少。考虑到全连接层在不同尺度下的特征提取能力不同,本文对传统的单通道全连接层进行改进,设计了一种新的双通道卷积神经网络,不仅提高了网络性能,而且增强了网络的特征表达能力。使用传统特征提取方法易出现识别错误率高,对光照、姿态和遮挡变化容忍度差等问题,本文设计的双通道卷积神经网络模型能有效解决这些缺点。2.传统的激活函数都只能拟合二维函数,Maxout却可以拟合任意维度的函数,为了能够更精确地表达高维特征信息,在全连接层用Maxout激活函数代替传统的ReLU激活函数;与传统的激活函数相比,Maxout激活函数的输出具有非稀疏性,将其与Dropout技术结合使用,Dropout用在Maxout网络层的后面,优化了网络内部结构。3.理想的面部表情特征具有比最小的类间距离更小的最大类内距离,但现有算法很少能有效地实现这一标准。本文在模型训练过程中使用A-Softmax损失,通过操纵特征面产生角度间隔,使用角度作为距离度量,将角度距离和学习到的特征相结合,增强了对不同面部表情特征的辨别能力。4.设计并实现了人脸动态表情识别系统,并使用不同卷积神经网络模型进行了动态表情识别实验,结果表明,双通道卷积神经网络具有较好的识别准确度和实时性,可应用于实时的人脸表情识别。
其他文献
吉林省延边州朝鲜族双语教育主要指朝鲜族基础教育阶段的双语教学,是以朝鲜语为母语,学习第二语言(汉语)的教育活动过程,是学生在学好本民族语言的同时学好汉 The bilingual
从20世纪开始,作曲家们不断在探索其它的创作途径,其中一些创作上的极端表现如荆棘丛生,使听众疏远了。一些年轻人,一味地求新求异而漠视我国老一代音乐家的创作经验。事实上
<正>在国家新闻出版广电总局的关心与支持下,在中国科学院的关心指导下,在各界同仁的共同努力下,经过长期酝酿和精心筹备,《信息安全学报》终于正式创刊发行。伴随着信息技术
高原环境会对人体生理和心理产生严重的影响,制约着部队战斗力生成,急性高原病是进驻高原部队卫生减员的主要因素。本文通过对部队进驻不同海拔的急性高原病发生率进行调查,
在国际投资条约中,投资准入是平衡国家经济监管权和开放投资义务之间最重要的砝码。在“符合东道国法律”的基础上,中国与中亚五国间的投资准入规则经历了从外资公平待遇到出现
背景:异基因造血干细胞移植(allogeneic hematopoietic stem cell transplantation,allo-HSCT)是目前临床上用于治疗恶性血液病最有效的方法,而移植物抗宿主病(graft-versus-
设计了一种采用多种策略的建筑脚点提取方法,针对建筑脚点提取中的两个关键步骤——数据分类和建筑脚点分割,分别提出和引入了邻近关系和r半径点密度,从仅反映单次反射的DSM数据
目的 高危冠心病经桡动脉途径行冠状动脉介入治疗术临床疗效、心功能及预后分析。方法 选取2015年5月~2017年5月在我院经桡动脉途径行冠状动脉介入治疗的64例高危冠心病患者
考虑到一系列影响因素将影响无线电磁波的能量损失。在本文中,将主要讨论电磁波在不同传输环境中的能量损失模型,并对电磁波在电离层损失情况进行仿真,验证了模型的有效性。
蒙古族寺庙的装饰纹样内容丰富,形式多样,它们是蒙古族精神文化的表达,也是其民族艺术审美的传达。本文从象征性、秩序性两个方面切入,研究蒙古族寺庙装饰纹样的形式特征,通