基于残差网络的图像表情识别

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zero_ak47
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
表情是情绪的外在表现形式,在人类日常生活中具有重要作用,相较于语音、语言等能够传递出更多的信息量。表情识别是让人机交互过程更加人性化、智能化的一种方式,能够让机器捕捉到人类的情感信息,完善交流过程。由于不同面部表情之间的特征相似性高,数据集逐渐从实验室走向复杂的真实环境之中,这些都使得面部表情自动识别的理论研究和项目落地过程中充满了难点。同时,流行的深度学习算法在训练阶段对内存和计算机算力有较高的要求。因此,为了让模型的特征提取能力得到有效提高,降低训练时对计算资源的依赖,本文从模型结构、损失函数以及归一化方式等角度提出了不同的改进方法。本文主要研究工作和贡献如下:1、以残差网络为基本结构,在残差结构中引入了索贝尔算子,强调了图片的边缘信息,增强了网络提取特征的能力,有效提高了最后模型的分类性能,在FER2013数据集和CK+数据集上分别达到了72.778%和95.96%的准确率,结果优于当前的一些其他算法。2、在中心损失函数的基础上,引入新的约束项,提出了一个新的损失函数,能够根据样本与其对应类别的中心之间的距离以及各个类别中心之间的距离修正类别中心的位置,使得同类别间样本特征更加紧凑而不同类别的特征簇更加远离,最后采用联合损失函数进行网络优化,在MNIST手写数字数据集上进行了可视化分析,以及在公开表情识别数据集上进行表情识别分类能力的实验,测试结果充分说明了此损失函数的有效性。3、训练时采用的批量大小与最后模型性能具有相关性,较大的批大小需要占用更多的内存以及计算资源,为了降低模型对于批大小的依赖性,将滤波器响应归一化嵌入到网络之中,在平衡和改善数据特征分布的基础上尽可能的保留提取到的特征的信息量,在FER2013数据集上达到了73.475%的准确率,且对比试验证明了在降低批大小之后模型性能减弱程度很轻。
其他文献
LED屏能够显示图形和汉字,应用于列车广播系统给人们日常生活带来更多方便,LED点阵显示屏较为多见。文章对重庆六号线列车广播系统车侧LED屏坏点检测进行研究,以提高故障检测效率,并提供对应的维修措施,以提高列车广播系统服务质量。
期刊
废用性肌萎缩是一种常见临床并发症,其具体表现为肌肉体积萎缩、肌肉失活、肌肉力量下降等。常见的预防与治疗废用性肌萎缩的手段包括运动疗法与物理疗法。运动疗法中最常见的仪器为持续被动运动(CPM)康复器,它能够促进骨关节软骨再生和修复,但由于肢体缺乏主动运动,肌肉活性提高的程度是有限的。电刺激疗法是目前最流行的物理疗法,它能够强化患侧肌肉收缩来预防和治疗废用性肌萎缩,但是却存在易疲劳、参数选择依赖治疗师
学位
图像作为最容易被人类所认知和接受的信息载体之一,在日常生活和科学研究中的地位愈发重要。在图像质量评价(Image Quality Assessment,IQA)领域中,我们需要设计一种能够对失真图像的质量分数做出客观评价的算法,最终得到的评价结果与人眼实际观测结果一致。其中无参考(No Reference,NR)IQA可以直接输出失真图像的质量分数,不需要其他任何参考信息,具有非常重要的研究意义和
学位
学位
随着计算机科学技术的飞速发展与相机设备的广泛普及,计算机视觉技术取得了长足的发展。在计算机视觉技术中,纹理特征作为图像识别、语义分割与场景理解等视觉任务的基础,在人脸识别、表面材质检测、工业检测、医学图像分析与遥感图像分析等领域得到了广泛应用。现有的纹理特征分类方法在识别精度与计算复杂度存在一些问题,并不适用计算资源受限的边缘计算平台。因此,为了提高纹理分类任务的性能表现,同时降低纹理分类模型的计
学位
随着半导体技术的发展,集成电路的制造工艺和技术水平不断提高,晶圆制造加工过程中引入的缺陷对芯片造成的影响也越来越严重,因此晶圆缺陷检测在整个半导体工艺流程中至关重要。按检测设备的发射源来分,缺陷检测可以分为光学检测和电子束检测。虽然电子束检测相比光学检测方法具有分辨率高、景深大、检测灵敏度高等优点,但由于常规电子束检测设备采用的是单电子束结构,其具有检测速度缓慢、吞吐量低下的问题,因此目前电子束检
学位
随着集成电路工艺技术和体系结构的发展,单片芯片上集成的处理器核数增加,传统的总线架构不能满足多核并行处理的通信需求。片上网络(Network-on-Chip,No C)以其极高的并行性和易扩展性代替了传统总线架构,在实际应用中被广泛使用。由于芯片的规模及工艺节点的不断发展,由生产缺陷、电路老化等因素导致的故障频率提升,片上网络需要容错路由机制来保证数据包的正确传输。其中,针对于电路中的永久故障,空
学位
公路的安全通畅是一个国家经济发展的重要保障,而路面的缺陷如裂缝、坑洞及绿化带区域的植物生长超过护栏遮挡路肩的情况等,都潜藏着交通事故的隐患。及时找出缺陷并加以修复就显得尤为重要,但对缺陷的排查却非常消耗人力物力,路面缺陷识别逐渐成为研究的热点。传统的数字图像处理方法虽然因为流程较短因此速度较快,但都有着不足之处,鲁棒性不强。而近年来在计算机视觉领域,深度学习的方法在各种应用中都有显著的成果,在路面
学位
随着无线通信技术的迅速发展,通信用户数量的不断膨胀,通信系统的传输效率以及传输功率效率的要求越来越高。毫米波以其可用频谱资源丰富的特点,成为了新一代通信的重要技术之一。射频功率放大器是无线通信系统必需的组件,为了降低传输系统的成本,并获得理想的功率效率,毫米波系统常使用具备高功率增益的非线性功放。在毫米波传输系统中采用恒包络调制技术可以有效避免功放工作在非线性区而带来严重的波形失真、频谱泄漏等问题
学位
随着视频平台用户生成内容的数量爆发式增长,通过视频内容在视频库中查询相关视频的视频检索算法被广泛应用在版权保护、新闻事件聚合和个性化推荐等场景中。视频检索是一个包含同源复制视频片段检索和事件级视频检索的多维度细粒度的任务,非常具有挑战性。现有的视频检索相关工作缺乏对视频结构信息的提取和对语义信息的理解。同时,多数工作仍然依赖于人工标注的相关视频对,不利于泛化性能的提升。本文提出了全新的视频检索架构
学位