【摘 要】
:
情感是一个奇妙而有趣的现象,它与人的日常生活、决策活动和身心健康等诸多方面紧密相关。作为人工智能领域的前沿研究方向之一,情感识别在涉及智能人机交互等相关应用场景中具有重大的潜在应用价值,开展情感识别方法的研究具有重要的理论和现实意义。语音和面部表情是最常见的两种承载情感信息的方式。并且,通过语音和表情识别情感还具备数据获取方便和非侵入性的优势。当前情感识别面临的主要挑战有:(1)情感信息难以有效表
论文部分内容阅读
情感是一个奇妙而有趣的现象,它与人的日常生活、决策活动和身心健康等诸多方面紧密相关。作为人工智能领域的前沿研究方向之一,情感识别在涉及智能人机交互等相关应用场景中具有重大的潜在应用价值,开展情感识别方法的研究具有重要的理论和现实意义。语音和面部表情是最常见的两种承载情感信息的方式。并且,通过语音和表情识别情感还具备数据获取方便和非侵入性的优势。当前情感识别面临的主要挑战有:(1)情感信息难以有效表征;(2)身份多样性对情感识别算法存在干扰;(3)多模态情感难以高效融合。围绕以上问题,本文对语音情感识别、表情识别和多模态情感融合展开了深入研究。本文的主要工作和创新性贡献如下:针对语音情感信息难以有效表征的问题,本文提出了为声学数据定制的时频卷积和序列建模神经网络结构。该结构针对声学数据进行网络结构定制,克服了单纯依赖数字信号处理或普通神经网络结构进行情感特征提取时的局限性。在保持语音信号中情感信息不损失的前提下,可以充分利用神经网络的表征能力。实验结果表明,基于时频卷积和序列建模的方法能够实现更高的情感识别准确率。针对身份多样性对表情识别导致的干扰问题,本文提出了身份/情感耦合损失函数。在评估表情识别性能的同时,该损失函数还衡量了表情向量在身份空间的相似性。实验结果表明,该函数能够减轻由身份多样性对表情识别带来的干扰,相较于传统的交叉熵损失函数,基于身份/情感耦合损失函数训练得到的模型不仅能够达到更高的表情识别准确率,而且能够减小由身份多样性引入的情感向量偏差。针对音视频情感分类任务中客观存在的“信息污染”、“信息冗余”和“融合效率低”的问题,本文提出了一种用于音视频情感融合的深度权重融合方法。该方法使用帧级别的硬权重策略对音视频模态进行关联建模,使用深度神经网络进行情感表征的计算以及多模态情感表征的高度非线性融合。实验结果表明,该方法能够明显减轻音视频情感分类任务中的“信息污染”、“信息冗余”和“融合效率低”等问题。针对多模态连续情感估计中跨模态情感信息难以充分挖掘和利用的问题,本文提出了基于多模态注意力的多维度连续情感估计方法。该方法通过多模态关联建模对人脸和语音之间的内在联系进行了充分挖掘,并将其与一些重要的先验知识相结合,以多模态注意力的方式约束情感表征的融合,最终实现多维连续情感的估计。不同维度情感状态的估计是以多任务学习的方式在一个模型中同时实现的。实验结果表明,该方法能够分别提高多维连续情感估计的一致相关性。本文提出的方法,有效提高了基于语音和面部表情的情感识别性能,具有重要的理论指导意义和实际使用价值。
其他文献
第一部分牛磺熊去氧胆酸减轻顺铂致听毛细胞损伤目的:探明牛磺熊去氧胆酸(TUDCA)对顺铂致大鼠听力损失的拮抗效应,揭示TUDCA对顺铂作用下听毛细胞的保护作用及量效关系。方法:(1)体内实验:选用12只健康成年雄性SD大鼠,给予腹腔泵注12mg/kg顺铂(持续时间>30分钟)。右耳于顺铂给药前1小时鼓室注射0.5mg/ml无菌TUDCA,左耳注射等量PBS。分别于给药前后进行听性脑干反应(ABR)
研究背景:肝细胞肝癌(简称肝癌,HCC)相关死亡占肿瘤相关死亡的第三位,根据流行病学研究发现,由于致病因子和人口结构等因素改变,目前全世界肝癌发病人数正在不断上升。早期肝癌主要通过手术切除,然而术后大约~75%的患者在5年内出现复发转移。同时大部分患者在肝癌进展期才被发现,因此肝癌总体预后没有获得明显改善。因此探究肝癌转移机制,寻找肝癌潜在干预方式至关重要。变异或功能异常的转录因子通过调节基因异常
巨噬细胞产物能影响机体的代谢水平,如引起肥胖的发生。代谢性适应也是巨噬细胞极化和可塑性的一个关键组成部分,有助于巨噬细胞在炎症、稳态和免疫调节中发挥功能。Kdm2a催化的H3K36me2去甲基化在细胞增殖、分化和凋亡过程中发挥了重要的表观遗传调控作用,但其在巨噬细胞及肥胖的发生发展过程中的作用尚未被阐明。在该项目研究中我们发现,巨噬细胞中特异性敲除Kdm2a可以增强巨噬细胞脂肪酸摄取和脂解作用,调
锂离子电池作为兼具高能量密度与高功率密度的能量存储器件,已广泛应用于便携式电子产品、电动交通设施等设备中。然而,商业锂离子电池处于高温环境(>55°C)时,聚烯烃隔膜的热收缩引发的内短路易使电池发生热失控,且传统电极中粘结剂的失效也会使电极材料脱落,导致电池的严重安全事故,无法满足航空航天、石油工业等领域在高温环境的应用需求。为了实现锂离子电池在高温环境下的应用,亟需设计制备安全稳定的锂离子电池隔
近年来,受大脑工作机制启发建立具有人类水平的类脑智能逐渐成为人工智能领域研究的热点,因此借鉴大脑的信息处理方式,建立存算一体的神经网络以实现具有学习、记忆及产生情感等能力的类脑智能是必要的。然而当前有关类脑智能的诸多研究并未基于神经元、突触等基本单元构建存算一体的类脑信息处理架构,导致无法执行分层和并行的信息处理,不能有效解决冯·诺依曼瓶颈,且由于过多地简化了大脑的相关工作机制,使得所实现的功能不
电磁成形是基于脉冲电磁力实现金属工件塑性形变的高速成形技术,具有可提高材料成形极限、抑制工件回弹和起皱等优点,是目前提升铝合金等轻质金属构件性能及制造水平最具潜力的方法之一。然而,电磁成形过程涉及电磁、热、力等多物理场耦合,导致工件变形受到高速、高温和大电流等诸多因素影响,其宏微观变形行为较准静态以及其他高速成形更为复杂,相关的材料力学性能和变形机理尚未被有效揭示,限制了该技术进一步的发展和工业化
储能材料结构中的无序特性对其电化学性能有着重要影响。目前由于缺乏合适的表征手段,对储能材料的无序特性与其电化学性能之间的构效关系研究较少。针对上述问题,在本论文中,我们利用全散射(total scattering)和原子对分布函数(pair distribution function,PDF)分析技术,表征了电极材料中的无序结构,构建了材料的无序结构模型,探究了结构无序与电化学性能之间的构效关系。