基于深度学习的人脸表情识别算法研究

来源 :南昌航空大学 | 被引量 : 0次 | 上传用户:lolotang530
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着模式识别和人工智能领域的不断发展,人脸识别技术亦日趋成熟,而人脸表情识别与人脸识别技术息息相关,其已逐渐成为人工智能、模式识别和人类情感理解等领域的研究热点之一。传统的人脸表情识别算法依赖于人为设计的特征,算法设计周期较长且识别率有限。神经网络识别算法依赖于自身的网络架构和数据集样本训练的模型,在经过大量的人脸表情数据集训练后,识别精度较传统算法更高,但会耗用更多的计算资源且延缓网络模型训练时间。本文针对以上的问题,提出多个改进的网络模型用来提升网络的识别准确率和加快网络模型的收敛速度,主要研究工作如下:(1)提出一种SR-VGG19网络模型识别人脸表情图像。SR-VGG19网络模型是在VGG19网络模型基础上,加入了优化后的残差模块。在网络的最后一层卷积特征图上,采用改进的区域候选网络(Improved Regional Proposal Network,IRPN)代替滑动窗口以避免图像特征的重复提取;同时为了提高图像特征表达能力和加快网络模型收敛速度,在卷积层和全连接层之间增加空间金字塔池化技术(Spatial Pyramid Pooling,SPP)和引入批标准化(Batch Normalization,BN)。在网络模型训练阶段,为了避免网络出现过拟合现象,采用L2规范化对交叉熵损失函数进行约束和限制。针对CK+数据集,为避免网络由于CK+数据集过小出现过拟合现象,本文对CK+数据集进行增广处理,实现数据集样本扩展的目的。采用经典的FER2013和CK+人脸表情数据库对该算法与2013年Kaggle比赛前十名的算法和最近几年提出的人脸表情识别算法分别进行人脸表情识别准确率的对比实验,验证了本文算法的优越性。(2)提出了改进的SENet网络(Squeeze and Excitation Networks),该网络不仅可以增加网络模型的识别准确率且加快网络模型在训练过程中的收敛速度。SENet网络通过采用Squeeze和Excitation策略对特征通道间的相关性进行建模,然后通过Reweight操作来实现特征权重重分配。Squeeze操作通过压缩空间维度,使多个二维的特征通道降至一维实数,且此一维实数的输出维度与输入的特征通道数相一致;其次Excitation策略通过学习参数w来实现每个特征通道权重分配;最后Reweight操作将Excitation输出的权重逐通道加权到先前每个通道的特征上,完成特征维度上的改进。(3)在ResNet18和VGG19网络模型基础上引入改进的SENet网络,提出SE-ResNet18以及SE-VGG19网络模型。在网络模型中,引入基于模型结构迁移、归纳式迁移学习方法以及PReLU激活函数,以加快网络模型在训练过程中的收敛速度。同时为消除类别不平衡和挖掘难分样本信息,在网络中增加Focoal Loss损失函数。为了避免网络出现过拟合现象,在网络中应用Dropout和批归一化(Batch Normalization,BN)策略。实验结果表明,SE-ResNet18以及SE-VGG19网络模型的精准性和快速性均优于Network C、Modern deep CNNs、Deep model网络模型。(4)采用空间金字塔池化技术(Spatial Pyramid Pooling,SPP)解决了VGG网络模型限制输入图像尺寸的问题。由于VGG19网络的全连接层要求输入的特征维度保持恒定,因此在VGG19网络中引入SPP方法来解决此问题。SPP通过利用多个不同尺寸窗口对最后一层卷积层提取的特征图进行池化处理,分别将得到的结果进行合并从而得到固定长度的输出。SPP是一种多尺度的池化,可以从不同尺度反映图像的特征信息,提高了尺度的不变性;且多窗口的池化操作可提高网络识别准确率。从某种程度上来讲,通过SPP可以增强图像提取特征的表达能力,进一步提高VGG19网络模型对人脸表情进行识别的准确率。
其他文献
植物叶片的解剖结构发育与光合性能不仅受其自身光环境的影响,而且还受到其他部位光环境的影响,即光依赖性系统调控。在玉米大豆带状复合种植模式中玉米普遍生长于异质性光环境中,本研究中选取了两个生理特性不同的玉米品种,以研究植株两侧光异质性对新发育叶片的光合性能以及解剖结构的影响,分析了不同品种玉米对光依赖性系统调控的响应差异,为玉豆模式中玉米品种的选育及田间配置的优化提供理论依据。结果表明,在异质性光下
异喹啉类生物碱是一类含氮杂环化合物,具有显著的药理活性。作为其重要组成部分的阿朴菲类生物碱在植物中具有较为广泛的分布,阿朴菲类生物碱不仅具有独特的化学结构,且具有多种药理活性。(-)-Misramine(2,3)是从埃及蔷薇属植物中分离提取的骨架极其独特的阿朴菲类生物碱,研究发现其在神经系统控制领域具有很显著的生物活性,且有一定的抗病毒活性,鉴于此类化合物具有的以上优良活性,和其具有四氢异喹啉并环
现代卫生填埋场衬垫系统往往由压实黏土(CCL)、土工膜(GM)、土工织物(GT)、土工格栅(GG)以及土工复合材料等组成。这些防护材料相邻界面的抗剪强度小于垃圾填埋体本身的抗剪强度,这使得在受到相同剪切应力时,土工合成材料界面会率先发生滑移来消耗系统中的剪力。因此,在已发生的垃圾填埋场失稳案例中,大部分是沿着衬垫系统中土工合成材料薄弱界面发生滑移破坏。目前国内外研究学者对衬垫系统中CCL-GM界面
因化石燃料的使用和开采造成的能源与环境问题日趋严重,氢能作为一种清洁、无污染的能源被认为是替代化石燃料的最佳选择,而利用半导体光催化分解水制氢气是解决能源危机及环境污染的重要措施。由于硫化物固溶体对可见光具有较强的吸收能力及较好的光催化产氢活性而被广泛研究。本文主要围绕硫化物固溶体的改性及光催化制氢性能进行研究,具体分为两个方面:1.以无毒的红磷作为磷源,以一乙醇胺作为溶剂,通过简单的低温溶剂热法
数据已经成为了核心的战略资源之一,无论是社会进步还是企业成功,越来越依赖于对数据的分析。数据一致性和数据时效性作为数据质量管理中重要组成部分,一直是相关领域的研究重点。数值数据在医学和金融等领域内广泛存在,提高数值数据的数据质量无论是作为企业数据储备、高质量数据分析的基础还是用于开发相关应用,都有足够广泛的应用前景。改善数值数据的一致性与时效性一直是领域内的研究热点和重点。数据的时效性错误和一致性
社交媒体网站、电商网站等数据都呈现出爆炸式增长,产品推荐方法应运而生。但是在实际的应用场景中,如何把合适的产品在合适的时机推荐给合适的消费者是电商一直关心的问题,而用户画像可以很好地解决这一问题。目前的基于用户画像的产品推荐方法主要存在以下问题:1.很少考虑用户的社会网络信息。2.大多基于单一标签进行画像,往往忽略了基于用户兴趣画像的标签集合。3.已有方法的推荐结果往往可解释性较差。因此,针对这些
现今,科学技术发展迅速,越来越多的海洋资源被发现,然而,仍有超过90%的海洋资源未被探索。海洋资源的探索与开发需要先进的技术与装备,水下机器人是唯一能够深海工作的重要装备,在海洋开发中具有重要的作用。无人无缆自主式水下机器人(AUV:Autonomous Underwater Vehicle)由于其机动性好、作业范围大等特点,在海洋开发中扮演中重要的角色。AUV工作于复杂海洋环境中,其自主控制需要
本论文旨在探讨苏轼黄州时期诗歌创作样貌。在人生境况的变化下,苏轼的诗歌创作也出现转折点,内容偏向、风格特色等都“为之一变”,在整个苏诗历程上处于承上启下的作用。全文共分为五个部分进行探讨,梳理如下:第一章为绪论部分。第二章主要通过苏轼黄州时期诗歌创作,探讨诗人在贬谪中的生存状态。第一节展现苏轼由地方官到谪臣的身份转换下的心态,由幻灭、纠结到实现短暂认同。第二节论述苏轼在身份认同下寻求着消解悲剧意识
蛋鸭的生产性能受多种因素的影响,包括品种、营养和饲养管理等因素。近些年,随着网床平养模式在蛋鸭养殖中的推广与应用,蛋鸭养殖集约化和规模化程度也逐渐增加。动物群体饲养规模影响到动物的生长发育和生产性能,也是动物健康和动物福利的关键参数之一。但目前,关于群体规模大小对家禽生产性能影响的研究主要集中在蛋鸡上,对蛋鸭生产的影响还不较少。本研究拟以金定鸭作为研究对象,在饲养管理及养殖密度等条件一致的情况下,
社会网络是一种个人或集体之间为了交换信息而组成的关系网络。社会网络存在社区结构特性,网络会根据其本身的拓扑结构被划分为多个社区。社区之间是通过桥节点联系的,因此需要在桥节点中寻找关键节点,通过保护关键节点从而保障社会网络社区间的连通。本文针对社会网络社区结构特性,在社会网络中评估关键节点。论文根据社会网络的社区结构特性提出了一种基于桥节点的社会网络关键节点评估方法。本文构建了社会网络场景,并采用N