特征完备化的跨数据集表情识别

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:NC330201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能技术的发展,表情识别的研究取得了突飞猛进的进展。大多数算法的良好表现依赖于训练集和测试集的分布一致性条件,但是诸如图像采集条件、个体属性等因素的不同会使得数据间存在较大的分布差异。因此当把模型应用到新的未知分布的数据上时,其识别精度会有一定程度的下降。跨数据集的表情识别问题具有重要的学术价值,该问题的解决有利于推动表情识别的广泛应用。现有的跨数据集的表情识别方法缺乏对干扰信息的有效排除,使得模型在未知数据集上提取的特征中包含了域信息和身份信息等冗余信息,缺乏对表情特征的完备性描述,这是导致其分类效果下降的主要原因。因此,如何提取更加完备、干扰信息更少的表情特征是跨数据集的表情识别的关键。本文基于深度卷积网络,以构建跨数据集的表情识别系统为目标,围绕建立表情特征更加完备、抗干扰能力更强的特征空间开展研究。分别从减少域特征和中性人脸特征的干扰的角度进行了探索,有效地提高了模型的迁移能力和分类效果,本文的主要工作包括以下几点:1)基于域对齐和特征判别力约束的跨数据集的表情识别本文从减少域信息的角度来提高表情特征的完备性和鲁棒性。利用最大均值差异来衡量不同源域数据之间的分布差异,进而辅助表情识别任务在特征选择的过程中去学习对域变化鲁棒的特征。同时,在目标函数中引入了余弦相似度作为特征判别力约束,充分保证表情特征的判别能力。分布一致性约束和特征判别力约束的结合使模型在去除域信息等干扰信息的同时更多地关注表情信息,进而在未知数据集上提取到更加完备的表情特征。在通用的表情识别数据库上的实验证明了该方法的有效性。2)基于残差特征学习的跨数据集的表情识别本文从减少中性人脸信息的角度来提高表情特征的完备性和鲁棒性,提出了基于残差特征学习的跨数据集的表情识别框架。在该框架中,人脸表情信息提取分支和中性人脸信息提取分支共享低层卷积层。由两个分支的差值计算得到用来实现分类任务的残差特征,残差特征具有更好的泛化能力和判别能力,迁移到未知数据后能更完备且鲁棒地表达表情特征。在多个数据集上的实验证明了该方法的有效性。3)基于域对齐和残差特征学习的跨数据集的表情识别域对齐方法和残差特征学习方法分别从不同的角度对提高特征的完备性进行了阐述。域对齐方法从数据整体呈现出来的分布出发来解决跨数据集的表情识别问题,而残差特征学习更多地从个体差异的角度来考虑问题。因此将域对齐方法和残差特征学习方法统一到一个框架下,既能减少特征中域相关的信息,又能减少中性人脸相关的信息,使模型对表情特征有更完备的表达,对干扰信息有更好的抵抗能力。在表情数据集上的实验证明了该框架的有效性。
其他文献
人脸识别是计算机视觉领域中十分重要的研究方向。人脸特征作为辨识性很高的生物特征,具有非接触式、不易更改、直接等优点,广泛应用于安防、刑侦、电子认证、银行交易等领域中。目前,受限场景下的人脸识别技术发展迅速,在研究和应用上都达到了很好的效果,而随着研究的深入,自然场景下的人脸识别成为了最为广泛且十分重要的需求。受限场景对于采集环境要求较高,自然场景中往往无法满足,其采集的人脸受到多种因素的影响,如表
随着软件开发技术的不断进步,测试验证方法和手段也需要不断完善,常见的负载压力测试已被广泛应用于服务器、Web应用、各类信息系统、网络系统等领域。但是专门针对嵌入式实时操作系统的相应负载压力测试研究还不够广泛和深入。中电32所自主研发的ReWorks嵌入式实时操作系统已被广泛应用于轨道交通、信息系统和工业机器等多种行业中,并被国防军事领域的多型装备所采用,是装备国产化的典型代表。,没有考虑到该操作系
通常软件测试中大部分工作是耗时耗力,其中最代价最高的是错误的定位,而在错误定位上的技术改进能降低测试的工作负荷。目前程序错误定位的方法主要包含基于程序动静态切片,基于程序频谱的语句分析方法等。动态切片由于可以通过分析目标行变量在测试运行过程中的依赖关系,去除不影响目标行变量结果的语句,将关注点转移到相关程序语句以减少考察范围。而基于频谱的软件错误方法(SFL)源于聚类分析中的相似一致性原理,相似性
面部肌肉、神经损伤的患者会出现表情扭曲现象,严重影响了患者的日常生活。对于患者而言,长期定时前往医院进行康复状况检查,需花费大量时间金钱。并且患者面对医生时可能由于紧张、害怕等心理因素导致无法表现出最好的状态,使康复状况评估不够准确。对于医生而言,为病人评估康复状况属于重复性基础工作,占用大量门诊时间,减少接诊病人数量。另外,目前诊疗以医生主观判断为主,尚没有一套客观评价体系能够对病人训练效果进行
人体三维重建作为计算机视觉的一个子领域在最近几年发展迅速,其应用领域也愈发广泛。一方面,这项研究对人们日常生活和工作的方方面面都提供了非常多的帮助。另一方面,这项工作在科研领域也为计算机理解人体三维信息,认知三维世界提供了可能,是未来计算机视觉变革的前沿。为了解决现有的人体三维重建方法存在的耗时长,精度低等问题,本课题在已有的基于深度信息的人体三维点云重建算法的基础上提出了新的基于单目相机的人体稠
显著性检测是指通过模拟人的视觉特征提取图像中的显著区域,是计算机进一步理解和处理图像的重要预处理方式。关于显著性检测的研究已经有很多,但是关于人类视觉系统是如何捕捉到显著性区域尚未有明确的的解释。同时因为大量图像也蕴含着丰富的前后景信息,显著性检测仍然有很大的进步空间。特别是当图像包含一个复杂的场景,如何高效准确地将显著性物体提取出来仍然是一个待解决的问题。随着卷积神经网络的快速发展,显著性检测已
随着移动终端和定位技术的发展,服务端存储能力提升,越来越多的时空数据可以被精确地采集和存储,为基于时空数据的应用发展提供了坚实的基础。其中,轨迹数据是由移动物体产生的一系列时空数据,对于轨迹数据的分析和挖掘能够给人们日常的出行带来一系列便利,比如导航、路径推荐、智能交通等等。其中,对于轨迹数据的异常检测能够从海量的数据当中发现可能存在的异常行为,对于规范轨迹数据产生方的行为具有积极意义。目前,关于
在计算机视觉领域的诸多研究方向中,视觉目标检测与跟踪是最基础也是最重要的研究方向之一,同时也具有广泛的工业应用场景。视觉目标检测与跟踪是计算机对环境物体进行感知理解最基础也是最重要的步骤,为进一步的高层级的理解任务奠定了基础。而在众多的目标检测与跟踪的算法中,对目标的定位准确度是其算法整体性能的关键所在。针对视觉目标检测任务,本文着眼于目标定位准确度,通过分析检测结果,发现了当前的视觉目标检测算法
红外图像凭借其被动探测成像和全天候不间断工作的特性,在以科技对抗为主导的现代军事对抗中发挥着重要的作用。由于红外图像的广泛使用,一系列军事方面的红外图像目标检测问题成为科研人员们研究的热点之一。其中远方舰船、导弹、鱼雷等军事设备因为目标距离远、信号弱、小范围等固有属性,在红外成像系统中呈现出弱小目标的特性,该类目标的检测问题成为学者们在该领域长期关注的难题。高辐射的海杂波信号使得目标若隐若现,由于