基于图像的生成式对抗网络模型研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:fbcpingqi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生成式对抗网络因其可以有效地学习数据的潜在分布,并可以生成高质量图像,逐渐在众多生成模型中脱颖而出,备受广大研究者关注。在图像迁移、视频生成、图像生成等很多应用领域中,生成式对抗网络均取得了丰硕的成果。本文针对生成式对抗网络的理论及其在图像生成应用中的问题进行了研究,包括提高生成式对抗网络的整体稳定性和训练速度,降低生成图像中噪音的产生。主要工作如下。首先针对由图像中存在大量冗余信息、和其本身的复杂性和多样性导致的生成式对抗网络训练速度缓慢和训练不稳定等问题,使用自编码器压缩模型对图像数据进行压缩,达到去冗余和降低复杂度的目的。但是经典自编码器压缩模型仍有不足,为了进一步提高自编码器压缩模型的压缩性能,提出了基于残差网络和注意力机制的自编码器压缩模型;为了解决网络模型中的梯度消失的问题在模型中引入了残差网络;针对网络整体特征提取的效率较低并且提取的特征中有大量冗余等问题,在模型中引入了CBAM卷积注意力模块。实验结果表明,基于残差网络和注意力机制的自编码器压缩模型稳定性和压缩能力更强。最后将自编码器压缩模型和生成式对抗网络相结合,提出基于自编码器压缩模型的生成式对抗网络。针对图像经过自编码压缩模型后特征已经不明显的现象,采取使用全连接层搭建生成式对抗网络,并使用更稳定的Wasserstein距离代替的原始生成式对抗网络中的交叉熵损失函数;针对生成式对抗网络生成的图像会夹杂着噪音的现象,引入了第二个判别器进行去噪。实验结果表明,基于自编码器压缩模型的生成式对抗网络,训练速度更快和所生成图像的质量更高。
其他文献
视频分析技术是研究人体与动物体姿态、动作与行为的重要技术手段。而姿态估计是动作表示与识别的关键环节,有着重要的研究意义。本文在水产养殖监控视频下利用视频分析技术研究条纹斑竹鲨鱼体姿态估计算法,在研究人体姿态估计中基于部件模型方法的基础上,实现从人体姿态估计到鱼体姿态估计的迁移。姿态估计是视频行为识别和分析的基础。本文在灵活混合部件模型(FMP)基础上提出语义部件模型对条纹斑竹鲨鱼体进行建模并求解其
卷积稀疏编码已经在图像处理领域取得了瞩目的成就,其是使用滤波器和特征图进行卷积以保持空间一致性,从而弥补了稀疏表示存在的不足。之后,基于深度学习思想的多层卷积稀疏编码也成为研究热点。该文是对卷积稀疏编码模型和多层卷积稀疏编码模型进行研究和改进,其中主要工作内容如下:首先,在门控可学习的迭代收缩阈值算法提高编码成分思想的启发下,该文将这种门控机制引入到卷积稀疏编码模型中,提出了带有增益门的卷积稀疏编
推荐系统在社会生产、生活中有着丰富的应用场景,推荐技术也在不断追求极致结果和高品质的用户体验,面对数据内容的日益增加,数据特征变得越来越稀疏,并且人们对平台个性化需求不断提高,机器学习、协同过滤等传统推荐算法和基于马尔可夫过程、循环神经网络的序列推荐算法都已无法很好满足需求。针对以上这些情况,本文从如何有效缓解数据稀疏性问题和提高推荐算法个性化的能力两方面入手,从序列推荐的角度入手,结合用户与物品
本文提出了一个在量子电动力学(QED)腔场中传送未知的两原子纠缠态的方案。在这个方案中,一个三原子纠缠Greenberger-Horne-zeilinger(GHZ)态被用来作为量子通道。我们让两个原子同时与一个单模腔场和一个经典场相互作用。经过相互作用时间t后,再在原子1的态上执行一个旋转操作R,这样就可以成功地实现量子隐形传送,且成功机率为1.0。另外,本文可以忽略腔场的衰减和热场效应对本方案
众所周知,机器人系统被认为是一种典型的多输入、多输出的非线性系统,在实际的工作中,不仅会出现速度信息无法测量的情况,而且还会受到外部干扰、非精准测量、负载的变化、摩擦力和随机扰动的存在、以及没有进行建模的动态性等各个不确定性因素的影响。以上各种不确定性的因素会直接或间接地对机器人系统的轨迹追踪性能产生不好的影响,使系统变得不稳定。因此,深入探究机器人系统轨迹跟踪控制器的设计问题就具有更加重要的理论
随着信息技术的快速发展,每天都会出现海量的文本信息。通过人工挖掘信息中蕴藏的丰富知识费时费力,如何快速高效地抽取和利用海量信息中的知识成为人们关注的热点。信息抽取作为一种从非结构化文本中抽取结构性信息的技术应运而生,事件抽取是信息抽取中一个极为重要的任务,正在受到越来越多研究者的关注。事件抽取包括两个任务:事件检测和元素抽取。首先,事件检测的主要任务是基于文本中的触发词进行事件的分类,当前基于深度
目前在海面溢油遥感领域上,公认最好的探测技术之一就是海洋激光诱导荧光(LIF)探测技术。它通过发射激光到海面获得含各种成分信息的荧光,之后分析荧光信号可以得到海面溢油的范围、溢油种类以及溢油厚度等信息。然而单纯的LIF探测系统探测的是一个点,因此可获得信息有限,不能够获取到海面溢油的各项应测参数,而且目前该领域只是对溢油污染未乳化阶段连续薄油膜(d≤10μm)有可用的理论研究成果和探测方法,本文据
即时定位和构图(Simultaneous Localization and Mapping,SLAM)在虚拟现实、增强现实等领域有着广泛的应用。基于特征点的SLAM系统在弱纹理、光照变化剧烈和快速运动的场景中,很难提取到足够的特征点或者特征点分布不均匀,从而导致定位的失败,而线特征在上述场景有良好的表现,本文重点研究了点、线特征结合的视觉惯导SLAM算法。研究内容如下:首先,针对在弱纹理的环境中提
脑机接口(Brain Computer Interface,BCI)技术构建了大脑与外部设备之间全新的连接方式,已经应用于医疗、交通和娱乐等众多领域。基于脑电信号(Electro EncephaloGram,EEG)的BCI技术,由于其无创、时间分辨率高等特性,被广泛应用于BCI系统中。然而,在目前的BCI技术中,EEG数据标注的时间和经济成本较大,且EEG信号存在时变性和个体差异,导致BCI系统
无人驾驶技术正逐步发展并得到快速进步,旨在简化汽车的驾驶操作并提高驾驶系统的安全性。然而无人驾驶车辆的行驶路况并不是单一不变的,面对一些极端场合,无人驾驶车辆需要进行高速行驶,在遇到弯道或者障碍不能减速时,控制车辆进行漂移也是有效的解决途径,因此保证无人驾驶车辆进行稳态漂移并保证车辆安全性是极具意义的研究问题。本文以无人驾驶车辆为对象展开研究:首先,对无人驾驶车辆的稳态漂移动态过程进行动力学分析,