人脸表情合成算法综述

来源 :数据采集与处理 | 被引量 : 0次 | 上传用户：metoo321

【摘要】

：

人脸表情合成技术旨在保留人脸身份信息的情况下,对人脸表情进行重建,从而生成具有新表情的源人脸图像。深度学习的发展为表情合成提供了全新的解决方案,本文从特征提取、生成对抗网络的表情合成和实验评估方面综述了人脸表情合成技术的发展。首先,介绍了人脸特征的提取,这是表情合成任务中的一项关键技术,人脸特征可客观全面地描述人脸表情状态。其次,分析了表情合成领域中主流的基于深度学习的方法,主要针对生成对抗网络(

【作者】

：

郭迎春王静洁刘依夏伟毅张吉俊李学博王天瑞

【机构】

：

河北工业大学人工智能与数据科学学院

【出处】

：

数据采集与处理

【发表日期】

：

2021年05期

【关键词】

：

表情合成深度学习生成对抗网络表情数据库客观评价方法

【基金项目】

：

国家自然科学基金(60302018,61806071)资助项目,河北省自然科学基金(F2019202381,F2019202464)资助项目。

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

融合卷积网络与残差长短时记忆网络的轻量级骨导语音盲增强

基于深度学习的骨导语音盲增强已经取得了较好的效果,但仍存在模型体积大、计算复杂度高等问题。为此提出一种融合卷积网络和残差长短时记忆网络的轻量级骨导语音增强深度学习模型,该模型在保持语音增强质量的前提下,能有效提升骨导语音盲增强的效率。该模型借助卷积网络参数量小、特征提取能力强等优点,在语谱图频率维度引入卷积结构,从而深入挖掘时频结构的细节和高低频信息间的关联关系以提取新型特征,并将此新型特征输入改进后的长短时记忆网络中,用于恢复高频成分信息并重构语音信号。通过在骨导语音数据库上实验,表明所提模型可以有效改

期刊

骨导语音盲增强卷积网络长短时记忆网络轻量级模型

一种高重复频率激发电路下的高速超声内窥成像系统

光学相干层析-血管内超声联合(Optical coherence tomography intravascular ultrasound,OCT-IVUS)成像技术能同时弥补光学相干涉成像的低成像深度与超声成像的低分辨率,能够较为全面地进行血管内的易损斑块识别,但受血管内超声(Intravascular ultrasound,IVUS)技术超声激发重复频率限制,OCT-IVUS成像难以在高帧率成像

期刊

超声成像超声激发高速成像血管内超声成像光学相干层析?血管内超声联合成像

生态文明视角下流域水力发电规划设计

文章提出水力资源开发需遵循的原则,重点对贺江干流和重要支流进行梯级规划,规划过程中综合考虑水资源的综合利用和生态环境保护的要求,经多次优化设计,制定了梯级开发方案,本轮规划期内贺江干流梯级规划为13级开发方案、大宁河干流梯级规划为8级开发方案、东安江干流梯级规划为5级开发方案。研究成果可以减小对生态环境的不利影响。

期刊

水力发电规划设计生态文明生态环境保护贺江流域

基于改进DBSCAN算法估计欠定混合矩阵的应用研究

针对欠定盲源分离(Underdetermined blind source separation,UBSS)问题,采用基于密度的空间聚类(Density based spatial clustering of applications with noise,DBSCAN)算法估计聚类中心时易陷入局部最优,因此由聚类中心坐标构成的混合矩阵的精度降低,导致信号分离结果不理想。本文在DBSCAN基础上提出布谷鸟自适应搜索群优化算法(Cuckoo adaptive search swarm optimizatio

期刊

欠定盲源分离群优化布谷鸟搜索算法空间聚类语音信号

基于多级残差网络的环境声音分类方法

为了对环境声音进行更好的识别和分类,提出了基于多级残差网络(Multilevel residual network,Mul-EnvResNet)的环境声音分类方法。对声音事件进行时标和基频压扩之后,提取其梅尔频率倒谱系数(Mel-frequency cepstral coefficients,MFCCs),以及它们的差分作为特征参数送入MulEnvResNet对声音事件进行分类。实验数据集采用ESC-50,将Mul-EnvResNet模型与端到端的卷积神经网络(EnvNet)、基于注意力机制的循环神经网络

期刊

环境声音分类多级残差网络时标压扩基频压扩

基于L0-IPNLMS的低复杂度数字助听器回声消除算法

针对数字助听器中回声消除算法计算复杂度高的问题,提出了一种基于集员滤波(Set membership filtering,SMF)理论的变步长基于L0范数的改进比例归一化最小均方误差算法(L0-norm constrained improved proportional NLMS,L0-IPNLMS)算法。该算法将集员滤波的时变步长引入到L0-IPNLMS算法中,不仅提高了系统的收敛特性,而且充分利用了集员滤波理论的数据选择更新特性,在误差幅度有界的前提下进行滤波器系数的更新,减少了不必要的迭代次数,降低

期刊

集员滤波计算复杂度数字助听器回声消除

融合声学特征和深度特征的语音文档分类

传统的语音文档分类系统通常是基于语音识别系统所转录的文本实现的,识别错误会严重影响到这类系统的性能。尽管将语音和识别文本融合可以一定程度上减轻识别错误的影响,但大多数融合都是在表示向量层面融合,没有充分利用语音声学和语义信息之间的互补性。本文提出融合声学特征和深度特征的神经网络语音文档分类,在神经网络训练中,首先采用训练好的声学模型为每个语音文档提取包含语义信息的深度特征,然后将语音文档的声学特征和深度特征通过门控机制逐帧进行融合,融合后的特征用于语音文档分类。在语音新闻播报语料集上进行实验,本文提出的系

期刊

神经网络语音文档分类语音识别深度特征门控机制

水电站尾水位特性解析与建模

准确解析水电站的尾水位特性是对其进行建模、从而实现尾水位高精度预测的关键。首先采用定性与定量分析相结合的方法揭示了水电站尾水位变化的后效性特征;然后基于相关性分析初步探明了尾水位变化过程的关键影响因子;进一步构建了水电站尾水位特性的多项式拟合模型和支持向量回归模型,并对比分析了各模型描述水电站尾水位特性的性能。溪洛渡-向家坝梯级和三峡-葛洲坝梯级水电站的实例研究表明,四座水电站2小时尺度的尾水位变化过程后效性特征显著,以当前和前一时段的下泄流量以及下游电站水位或下游支流来水为输入的支持向量回归模型是一种实

期刊

水电站尾水位特性尾水位预测相关性分析多项式拟合支持向量回归

海量网站中博彩类违法网站的捕获方法

针对海量网站中博彩类违法网站的检测问题,提出了一种基于BERT-BiLSTM与多分类器决策级融合的网站分类方法。该方法通过以下方式来提升分类性能:首先采用网页标签标题、超链接标题等优先的网页特征文本提取方法提升特征文本内容的丰富度;其次提出基于BERT-BiLSTM的文本分类模型,该模型具有良好的语句特征表示能力,从而提升分类性能;最后将网站标题、关键词和网页文本3种网站不同描述维度的分类结果进行决策级融合,进一步提升整个系统的性能与鲁棒性。通过采用多种策略生成疑似博彩网站的域名,提升该方法主动捕获博彩类

期刊

在线博彩网站检测自然语言处理决策级融合深度学习

水轮机热力学法测效率的改进方法

水轮机效率测试中的热力学法通过对能量转换中单位能量的测定来确定水轮机的流量和效率,无需直接测量流量.开展热力学法时,低压侧断面流速分布不均是影响测试结果准确性的重要因素.针对此问题,提出了一种通过迭代计算水轮机低压侧流速、流量及效率的改进计算方法.该方法无需进行流速测量,减小了测试的工作量.引入单位机械能的修正项和低压侧流速进行双重迭代计算,得出的低压侧流速更能代表水轮机低压侧的平均流速,进而得到更准确的水轮机流量和效率.测试实例表明,迭代计算数次后,可得到准确的单位机械能、水轮机流量及效率,能够满足工程

期刊

水轮机效率热力学法水轮机流量冲击式水轮机迭代计算

人脸表情合成算法综述

与本文相关的学术论文