基于卷积神经网络的人脸表情识别分类研究

来源 :西南财经大学 | 被引量 : 0次 | 上传用户:fa239831983fa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸表情做为一种常规且重要的情感交流表达方式,对其进行识别的智能技术也是人机交互的重要基本组成部分,在医疗、驾驶、教育等领域上发挥着重要作用,因此,对于人脸表情的识别研究一直都是学术界的热门课题且意义重大。在众多的的学习模型中,基于深度学习的模型是运用最为广泛的主流学习模型,其中又以卷积神经网络最为突出,在表情识别中取得了很好的效果,它能够自动取提取图像的表情特征,再加上神经网络本身不错的分类效果,卷积神经网络可谓是图像识别领域中强有力的“利器”,但传统的卷积神经网络的缺点就是网络层数多、参数量大,进而造成了计算量大、梯度消失和预测率下降等,为了解决这些问题,本文进行了相关的研究,主要工作如下:(1)对本次研究用到的数据集CK+和RAF-DB做了图像的归一化处理以及数据增强,将原本的数据集扩大了10倍,保证了网络的泛化性以及训练的可靠性。(2)基于经典的VGGNet,设计了一种改进的E1-VGGNet网络。对于VGGNet最后面的三个全连接层,首先是剔除了其最后的两个全连接层,只保留一个,然后在最后的卷积层和全连接层之间引入了全局池化操作,其主要任务是将输入的通道图并行进行最大和平均的全局池化操作以此得到两个新的特征,再将其连接在一起,做为最后的分类层的输入特征,这样减少了参数量并且保证了性能不会下降。同时在卷积层和全连接层分别引入Drop Block和Drop Out正则化策略,防止了网络在训练过程中可能出现的过拟合情况的发生。除此之外,为了解决在网络层输入时可能出现的一种数据分布偏离导致的梯度消失问题,在每个卷积层后做了批量归一化操作。最后通过实验分析得到了当size Block7_(28)的时候,E1-VGGNet的识别率最好,在CK+和RAF-DB上分别取得了95.52%和82.85%的识别率。(3)基于残差网络,设计了一种改进的分组混合残差网络E2-Res Net。此次设计利用残差结构去替换掉传统的“排队式”传播结构,以此来控制梯度消失、网络退化问题。其次引入了分组卷积减少参数量,最后再把卷积层输出的特征图进行重新混合,以此来融合各个卷积层中分组卷积后的信息数据,使得表情特征相互联系,同时引入全局池化、批量归一化、Drop Out和Drop Block操作。经过实验,分析得到采用分组数为4的E2-Res Net效果最好,在CK+和RAF-DB上分别取得了96.12%和83.87%的识别率。(4)基于集成思想,设计了两种以E1-VGGNet和E2-Res Net为子网络的集成网络E3-Ensemble Net和E4-Ensemble Net,其中E3-Ensemble Net采用了平均学习法的集成策略,经过实验,分析得到采用加权平均的效果要优于简单平均,权重分别赋予E1-VGGNet和E2-Res Net以0.46和0.56时效果最好,在CK+和RAF-DB上分别取得了97.34%和85.11%的识别率。E4-Ensemble Net采用了Stacking集成策略,经过实验,在CK+和RAF-DB上分别取得了97.71%和86.01%的识别率,证明了集成网络性能要优于单个网络。
其他文献
学位
针对一些大型的生产配送企业,由于各地生产方式或者配送方式的不同,导致商品由不同工厂所制造配送的补给成本存在差异,为了在车辆调度问题中综合考虑补给成本和运输成本,并使得总成本最小化,开展了考虑商品补给成本的带时间窗多车场路径问题研究,主要包括:建立基于分布式生产销售系统考虑商品补给成本的带时间窗多车场配送车辆路径优化数学模型;为了求解数学模型,根据考虑补给成本带时间窗的多车场车辆路径问题的性质和特征
液压泵是最早发明的动力源机械之一,作为液压系统的动力元件,液压泵已经普遍运用在工业、农业、军事、生活等领域,起到举足轻重的作用。如今人们对液压泵产品的需求量也仅仅略低于电动机。液压泵的名目繁多,应用场合根据泵的结构形式也各异,在液压泵发展演变中,对于性能参数、结构优化、噪声、摩擦副等方面的研究一直都在继续,但其主要的几种结构形式并未发生实质性的改进。本文简要概述了液压泵的分类、结构特点及研究现状,
学位
写作教学在高中语文教学中有着重要地位,但在现实的语文教学中,写作教学现状令人堪忧。从古诗文中寻找写作教学的出路,挖掘写作教学资源,是在读写理论基础上所进行的有效探索,对提高学生写作水平大有裨益。古诗文中蕴含着丰富的写作教学资源,主要体现为广泛的题材内容、多样的写作技巧、凝练的语言表达、独特的审美要素、巧妙的行文结构等,通过在古诗文阅读教学及写作教学中充分挖掘和运用古诗文的写作资源,可以提高学生的传
高速道岔在复杂交变荷载的循环作用下极易产生疲劳伤损,如处理不当,将严重影响道岔的安全服役性能。本文结合国内外学者的研究成果,系统研究了实际运营中复杂随机参数作用下道岔直尖轨的疲劳载荷特性变化规律,并确定道岔疲劳敏感区进行寿命预测。本文的具体工作及结论如下:(1)系统梳理国内外关于车辆-道岔动力学及疲劳损伤分析的相关研究方法及理论,明确复杂随机作用下道岔直尖轨载荷特性分析及疲劳强度寿命预测的研究意义
目的:面对日益恶化的环境和越来越大的生活压力,癌症的发病率在逐年攀升,寻找疗效确切的抗肿瘤药物刻不容缓。研究表明,蛋白甲基转移酶异常表达会导致组蛋白甲基化模式失衡并广泛促进人类癌症的发生发展。其中以组蛋白甲基转移酶(HMTs),特别是G9a(常染色质组蛋白赖氨酸N-甲基转移酶,EHMT2)为靶点的抗肿瘤药物研究为当前的研究热点。然而,目前G9a抑制剂的研究仍处于基础研究阶段,尚未有G9a抑制剂进入
学位
氟硼吡咯(BODIPY)是一类非常重要的荧光染料,其本身具有极优良的性能,如结构易于修饰、荧光量子产率高、具有较好的光热稳定性以及摩尔吸光系数高等。近年来,通过在BODIPY核心位置引入不同取代基,合成具有不同激发和发射波长的荧光探针,用于分子识别、生物成像、靶向药物设计以及光动力治疗等领域,引起国内外研究者的广泛关注。与传统小分子荧光探针相比,通过分子自组装构筑具有特定物理化学性质的荧光探针,在
人体内谷胱甘肽、超氧化物等活性小分子物质对于细胞及组织的的多种生命活动具有密切关系,是参与机体免疫、物质及能量的运输、信号的传导以及维持内稳态等活动的重要物质。同时,这些物质的含量与多种疾病的病理学研究相关,包括癌症、炎症以及各种骨骼和神经方面疾病等,都伴随这以上物质的异常分泌。因此,利用1,8-萘酰亚胺的双光子激发、高荧光强度等传统荧光物质难以具备的优势,针对这些物质设计高灵敏性荧光探针具有重要