基于频域网络和图网络的表情识别方法

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:dilanmeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为人机交互系统(HCI)中的一个重要组成部分,表情识别算法受到了广泛的关注与研究。近年来,基于深度神经网络的人脸表情识别方法为准确识别人脸表情提供了有效的解决方法,而传统机器学习方逐渐被替代。基于深度学习的表情识别方法的研究主要关注两个方面。1)从图像中提取有效的特征的方法,和2)深度网络结构针对表情识别领域的优化。然而,这些深度学习存在对特征之间的语义联系和算法复杂度的忽视的问题。这导致它们的可解释性较差、泛化能力差以及计算资源需求大。针对这些问题,本文结合传统特征提取,频域处理,和图深度学习等技术,研究提高人脸表情识别算法的总体性能的识别方法。本文针对这些问题提出的方法如下:(1)针对深度卷积神经网络的高计算复杂度和高容量问题,设计了一种基于频域深度学习的轻量级深度学习框架。本文首先利用表情的动作单元分布设计出归一化矩形特征作为人脸表情的特征表示和后续模型的输入。随后本文利用频域上的卷积滤波定理设计了对频域转换后的数据进行快速卷积滤波的乘积层,然后与常用的神经网络层一起构建了频域乘积网络(FMN)用于频域上高效的表情识别。(2)针对现有基于深度学习的表情识别方法中低可解释性和特征间缺乏语义联系的问题,设计了一种基于语义图的表情识别方法。其中,本文首先将表情转化成图结构表示,然后设计了时空图语义卷积网络(STSGN)来对表情中人脸特征的动态性和共现性进行建模,提取深度图特征后进行表情识别。(3)针对上一个方法中预定义的静态图拓扑结构带来的低鲁棒性问题,提出了一种基于动态图结构的表情识别算法。本文首先扩展了图卷积的方法并设计了一种基于自监督学习的图拓扑结构推理的网络组件。然后扩展了上一个方法中所提出的时空图卷积网络来对动态的图结构进行处理和表情的识别。通过分析一系列的对照实验和外部对比实验的结果,可以认为本文所提出的频域深度学习方法可以在有效降低模型容量和计算复杂度的情况下,提高表情识别的准确率并且减少模型训练所需要的时间。其次,基于图结构的深度学习方法由于利用了人脸特征的语义联系,使得网络构造的表情特征具备轻量化、高泛化性和高可解释性的优势。最后,基于动态图结构的表情识别模型可以进一步克服在野外环境下和在受遮挡环境下的表情识别难题。
其他文献
电网和综合能源的发展拓展了电力业务,催生了电力新业态,要求电力自动化体系具有更强的业务支撑能力。在此背景下,电力物联网的理论和应用成为了当前电力领域的研究热点。为了优化电力物联网的构建、设备部署和运行性能,提升电力物联网对电力业务的支撑能力,本文以电力物联网监控业务为例考虑电力业务,提出了电力物联网分布式云数据中心优化部署和云边资源配置策略,包括优化问题模型和问题求解方法。进一步,通过设置案例进行
农业地质调查是土地资源环境评价和自然资源管理工作的有效手段之一,其成果应用在现代农业发展、土壤污染防治等工作中具有重要指导意义。近年来,湖州市吴兴区开展了不同精度的农业地质调查工作,取得了丰富的土壤、大气、灌溉水、农产品地球化学数据和综合性成果。本文结合成果在湖州市吴兴区转化应用方向,提出了成果服务土地资源管理、现代农业发展、土壤污染防治等领域的相关建议,展望了农业地质调查成果在生态文明建设中的深
乙醇被认为是一种替代或改善常规化石燃料的可再生能源。经合成气制乙醇的工艺路线,特别是由合成气制二甲醚(DME),然后经DME羰基化和乙酸甲酯(MA)再加氢制乙醇,能实现煤碳资源高附加值利用,并可解决我国二甲醚、甲醇等产能过剩的问题。在各类羰基化催化剂中,氢型丝光沸石(HMOR)对DME羰基化制MA具有较好的催化性能,可避免使用贵金属和腐蚀性碘化物。但其面临的主要挑战是HMOR的十二元环(12-MR
基座作为中国传统建筑中具有较为完善发展脉络的一部分。在几千年的发展过程中,基座由初始用于减少地面潮湿、抵御洪水的单一功能,成为集功能、材料、结构、施工、艺术为一体的复杂的建筑部位之一。与建筑屋顶和墙身共同组成中国古代建筑立面造型和艺术表现的主要组成部分。近代广州的特殊历史沿革造就特殊的文化,在多方位西方建筑文化冲击、碰撞、交融下的广州近代建筑,具有独特的时代性、地域性和文化性。作为建筑重要组成部分
随着城市化进程的不断加快与人民生活物质水平的日益提高,机动车的数量也在大幅度增长,城市道路交通拥堵日益频繁严重。交通拥堵一般源于局部拥堵路口或路段,随着时间的推移拥堵车辆会逐渐向四周扩散至整个路网。本文以交通区域路网为研究对象,对区域交通状态分析和交通承载能力进行定义计算,并对过饱和状态下区域信号控制优化问题展开研究,主要研究内容包括以下几个方面:(1)为准确分析区域路网交通状态,利用交通饱和度分
肿瘤是危害人类健康的主要疾病之一。随着对治疗效果、治疗程序、副作用等的更高要求,多重疗效的药物和天然抗肿瘤药物越来越受到患者和研究人员的青睐。姜黄素作为一种天然抗肿瘤药物,由于其多种医学特性受到了广泛关注。然而,目前的姜黄素类药物仍然存在治疗效果低且疗效单一的问题。纳米纤维素作为一种从天然纤维素中得到的可再生纳米材料,具有很多优异的性能。本研究利用纳米纤维素得到的姜黄素递送体系和双重疗效药物颗粒具
随着热环境控制技术不断发展,人们对于建筑室内环境的热舒适性也相应的提出了更高更具个性化的要求。为了更好的解决人们日益增加的个性化的热舒适需求,建立一个具有准确性、稳定性、适用性和拓展性的个人热舒适模型是本研究的主要课题。本论文选取了夏热冬暖地区办公建筑人群作为主要研究对象,经过对机器学习与热舒适领域的适配性进行的深入研究,设计了基于堆叠策略的集成学习模型,并完成了从通用模型到个人热舒适模型的迭代,
随着社会和经济的发展,制冷已经进入人们生活的方方面面。传统气体压缩制冷技术由于能效比低、环境污染等问题,难以适应现代社会绿色高效制冷的要求。磁制冷技术具有机械结构简单、环境友好、制冷效率高等优点,具有广泛的应用前景。磁制冷材料作为磁制冷技术的核心,直接决定着系统制冷的功率和效率,因此高性能磁制冷材料的开发一直是磁制冷技术的重中之重。在众多磁制冷材料体系中,(Mn,Fe)2(P,Si)合金不含稀土元
随着经济的发展,城市交通拥堵加剧。公交优先发展方法作为解决交通拥堵问题的根本战略,却面临服务水平低,对乘客吸引度不够等劣势。在智能交通系统(Intelligent Traffic System,ITS)的背景下,常规公交的智能化信息化极大地提高了公交系统的可靠性和乘客的舒适度和出行效率,减少拥堵,降低污染排放。公交车行程时间是乘客们最关心的公交信息之一,它同时也是公交系统和交通大数据研究的热点问题
纳米TiO2具有高光催化活性、高化学稳定性、无毒性、成本低廉等优点,被视为最有吸引力的半导体光催化剂之一。纳米TiO2可负载在众多基质上形成纳米薄膜,赋予基质材料除污染物与抗菌等光催化性能。目前对该类纳米二氧化钛薄膜研究报道不多,纳米TiO2薄膜光催化活性对有机基质的影响报道更少。本文基于自制的具有可见光活性的纳米TiO2胶体,采用直接喷涂的方式在有机基质表面制备纳米TiO2薄膜,通过光催化降解甲