【摘 要】
:
图像翻译旨在将图像从源域转换到目标域。近年来,生成对抗网络在多种图像翻译任务中取得了显著成功。不过,这些方法在生成细节纹理方面仍然面临很大的挑战。这主要是因为,现有方法普遍忽略了图像结构信息对于转换过程的指导作用;且通常采用单一的生成器结构,难以描述图像中不同尺度、不同层次的结构细节。因此,本文首先提出了一种结构辅助的生成对抗网络,并将其应用于人脸照片-素描转换任务;然后,提出了一种基于异构互补网
论文部分内容阅读
图像翻译旨在将图像从源域转换到目标域。近年来,生成对抗网络在多种图像翻译任务中取得了显著成功。不过,这些方法在生成细节纹理方面仍然面临很大的挑战。这主要是因为,现有方法普遍忽略了图像结构信息对于转换过程的指导作用;且通常采用单一的生成器结构,难以描述图像中不同尺度、不同层次的结构细节。因此,本文首先提出了一种结构辅助的生成对抗网络,并将其应用于人脸照片-素描转换任务;然后,提出了一种基于异构互补网络的通用图像翻译框架。本文的贡献主要包含以下两点:(1)首先,本文提出了基于辅助结构的人脸照片-素描合成模型。人脸照片-素描合成旨在基于给定人脸照片/素描生成其对应的素描/照片。考虑到人脸这一特殊的结构,本文利用人脸解析掩码作为辅助输入,来辅助人脸照片-素描的生成。此外,本文利用感知损失,使生成图像保留输入图像中的身份信息;最后,本文采用多层堆叠网络进行细节优化,并对其进行了深入分析和验证。实验表明,本文的方法在可以合成具有逼真纹理并保持身份信息的人脸照片/素描,且在多种挑战性数据集上明显优于现有方法。(2)其次,本文提出了基于异构互补生成对抗网络的通用图像翻译方法。具体而言,本文分别使用深层U型网络和浅层残差网络构建了两个生成器。网络结构的不同,使得两者可以在不同尺度、不同位置上发挥不同的作用。之后,本文使用门控融合网络将两个生成器的输出进行加权融合,以产生最终输出。门控融合单元可以自动计算两个生成器在不同位置上的重要性,从而促使两者相互补充。最后,本文提出了一种多层集成判别器,使用多层次和多尺度特征促使生成器输出高质量的图像细节。在多种数据集上的定量和定性分析表明,在多种图像翻译任务中,本文的方法都显着提高了生成图像的质量。整体而言,本文提出了两种改进型生成对抗网络,并将其用于多种图像翻译任务中,有效提升了生成图像的视觉质量,取得了优于现有方法的性能。本文工作对于图像翻译的理论研究和应用推广有着重要的价值。
其他文献
碳量子点(CQDs),是一类尺寸在10 nm以下的新型碳材料。碳量子点具有生物毒性低、生物相容性良好、光致发光性能优异、易分散等优点,在离子检测、生物成像、药物运输等应用领域
电子供体(D)-电子受体(A)结构化合物分子内部不同基团之间可以发生电荷转移反应,通过调节电子供体和电子受体的基团种类、数量等方法可以对化合物吸收光谱和分子能级进行调控,从
随着药物的结构越来越复杂,数量越来越多,药物的研究已经进入一个大数据的阶段。如果仍然使用一般的生物实验的方法进行研究,成本高,周期过长。因此使用计算的方法对药物进行研究势在必行。其中预测药物的作用效果的算法就是一种高效,新颖的药物研究手段。尽管现在已经有大量的预测算法对药效进行预测,包括治疗效果、相关的功能路径等,但是这些算法在预测药效的同时引入了大量的先验知识,例如基于药物相似性网络的研究,正是
近年来,随着电网规模的不断扩大,电力系统运行设备的不断增加,系统运行的复杂性也随之增加,电力系统的安全稳定运行变得越来越重要。因此电力系统运行过程的状态监测技术和故
奇异摄动问题的数值方法是当前科学计算研究的热点问题,基于此,本文将从两个方面研究几类奇异摄动问题的数值方法.一方面,基于重心有理谱方法和相关智能算法,分别研究奇异摄动反应扩散方程和一类带参数的奇异摄动非线性方程的高精度数值方法.另一方面,研究了奇异摄动Burger-Huxley方程的自适应移动网格算法.具体内容如下:第一章介绍了奇异摄动问题的研究背景,研究意义以及相关研究进展,同时介绍了本学位论文
农林剩余物资源高效高值多元化利用及以可再生资源为原料制备复合材料是绿色材料领域的重要发展方向。天然植物纤维增强树脂基复合材料具有成本低、强重比高和环境友好等特点
Tor网络是目前最流行,且使用最广泛的匿名网络。Tor网络允许志愿者匿名并快速地建立中继节点,且中继节点的搭建门槛较低,这一开放性的态度在使其迅速发展的同时,也使其容易遭受Sybil攻击。针对Sybil攻击节点优化Tor网络路径选择策略是抵抗Sybil攻击的有效策略之一。但现有的Tor网络路径选择策略,都是针对某种具体形式的攻击进行防御,如端到端攻击、网站指纹分析攻击等,却不能综合抵抗多种形式的S
近年来,随着新兴的技术逐渐深入到旅游产业中,旅游的形态逐渐从传统旅游转向了文化体验式旅游,即需满足游客的基本旅游需求和对景区文化的深度体验需求。但当前大部分景区产品的文化展示形式单一,缺乏与景点文化相关的特色旅游内容,文化的传达效率较低。因此,本文结合了沉浸理论和多通道理论,论述其在文化旅游产品设计方面的指导意义:多通道交互为游客提供更优质的感官体验,沉浸状态让游客更容易感受到产品传达的文化内涵,
软件自适应技术陚予软件系统调整自身行为来适应环境变化的能力,极大地提高了软件系统的可用性和稳定性。自适应软件系统易维护、适应性强、容错性高且应用广泛。但是在软件系统引入自适应控制逻辑的同时,也为原有业务逻辑增加了额外的复杂度。自适应控制逻辑需要频繁地进行计算、通信和结构调整,消耗了大量系统资源。此外,自适应调整的及时性在一定程度上取决于自适应控制环路的执行频率,频繁运行的自适应控制逻辑严重拖慢了系
随着网络通信技术的快速发展,无线智能设备的大规模普及,移动数据流量的爆炸式增长,在接入点(Access Point,AP)上部署内容缓存被认为是有前景的研究方向。尤其是在AP密集部署的网络场景下,边缘缓存不仅可以有效减轻回程链路的负载,还可以缩短用户的下载时延。然而,设计无线边缘的缓存策略是具有挑战性的,内容的流行度与用户的偏好是影响缓存命中率的重要因素。AP使能缓存之后,关联策略也将发生改变,仅