基于生成对抗网络的变形图像生成算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:czy239239
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图片是人类传播信息的重要媒介。近年来计算机视觉的蓬勃发展离不开大量的图片和其标注。研究如何能自动化生成数据可以降低标注工作量,也能满足人类特定化编辑图像的需求。作为生成任务中的一种,变形图像生成因输出和输入存在极大的结构差异而极具挑战性,但其巨大的实际应用价值吸引着学者们不断进行深入调研。
  考虑到生成对抗网络在图像生成上的优异表现、泛用性和灵活性,本文对生成对抗网络进行结构和方法调整,用于应对两项极具应用价值的变形图像任务:中国书法生成和姿态变换。针对两项任务的特点,展开了如下研究:
  1)本文首先提出了使用生成对抗网络进行书法生成的方法。本文提出的模型包含两个生成器,分别是监督网络和转换网络。监督网络在训练时目标是重建书法图像,转换网络目标是将标准字体图像转化为书法图像。监督网络最核心的作用是为转换网络提供其解码器的低层监督信息,借助这些监督信息,转换网络的结果比之前的方法展现出更细节的局部笔画信息和更好的全局结构。
  2)本文针对姿态变换的任务,提出了有效的姿态注意力机制和渐进式生成机制。姿态注意力机制依赖姿态特征构造注意力遮罩,依据注意力遮罩有选择性地增强和抑制外貌特征;渐进式生成机制可以降低由姿态差异过大而导致的转换难度,从而使得生成结果更为自然真实。由于两种机制的有效性,相比于之前的方法,本文方法产生的结果具有更高的外貌和姿态一致性,并且模型更小,速度更快。此外,本文还验证了生成的人物图像可以作为扩充数据提升行人重识别任务的性能。
  基于以上研究,本文提出了两个有效的基于生成对抗网络的变形图像生成算法,用于针对性地应对书法生成和姿态变换两个具有挑战性的变形图像生成任务。充分的实验结果验证了本文所提出方法的有效性。
其他文献
滤波器组多载波-偏移正交幅度调制(FBMC-OQAM)具有高频谱效率以及低带外辐射等优点。但是作为一个多载波通信系统,FBMC-OQAM系统存在峰均比(PAPR)比较高的问题。本文对如何降低FBMC-OQAM系统的PAPR展开了研究,在经典的部分传输序列(PTS)算法的基础上,针对FBMC-OQAM系统提出了两种改进算法。
  在多载波系统中,频域中每个子载波幅度的改变会影响时域中的叠加波形。基于这一特性,本文首先在传统PTS算法的基础上对FBMC-OQAM信号在频域上进行幅度加权,提出了频域加权的
由于超低频(Super Low Frequency, SLF)通信具有穿透性好、抗干扰能力强、信号稳定等优点,被广泛应用于军事对潜通信、透地通信等领域。目前超低频通信系统大都是敷设百米甚至千米量级的电调天线作为发射天线,体积较大且无法灵活移动,因此,美国国防部高级研究计划局于2017年提出研发频率在30kHz以下的便携式超低频通信系统。为了减小天线的体积,本文用结构紧凑的线圈代替传统电调天线,收发线圈利用感应磁场传输信息,这种磁感应通信方式下有关超低频信号传输衰减规律的理论研究较少,因此,研究超低频磁感应
全球导航卫星系统(Global Navigation Satellite System,GNSS)正在扮演着越来越重要的角色,同时也在面临着各种各样的挑战。当前卫星导航信号的扩频调制方案是直接序列扩频(Direct Sequence Spread Spectrum,DSSS),而截获技术的发展给DSSS信号的安全性带来了严重的威胁。本文旨在研究新型的扩频调制方法,以提高卫星导航信号的抗截获能力,提升GNSS的安全性和可靠性。
  本文以提升卫星导航信号的抗截获能力为目标,提出了一种跳相扩频调制方法,
伴着一场大雪,北京迎来了2010年,21世纪第二个十年的开始。  2010年,作为时间轴上的新坐标,它本身并没有特别的含义,和每天的日出日落一样,平凡而新鲜。但当时间和人们的期望与梦想结合在一起就变得不太一样。  已经过去2009年,我们在去年第12期杂志上做了全面的盘点。面对新年,数码圈又将会有怎样的风景7全球最大的消费电子展CES2010即将召开,新一年的技术和产品也慢慢揭开面纱,向人们展示新
期刊
文本检索旨在对给出的查询,在文档集合中找出与之最相关的文档子集。它能有效地对文档中的语句词义进行压缩整合,并与查询进行匹配,利用计算机在处理海量数据上的优势,为人们迅速缩小查阅的范围,极大地提高了筛选与处理信息的效率。本文在对文本检索模型进行研究时发现,文本检索主流模型采用的是构建输入查询与文本的表示,文本与查询的关系取决于表示的相似程度。这种模型往往存在无法解决长距离依赖、无法对语义很好地建模的问题,导致模型的向量表示不能准确地表示出文本的语义信息。因此,本文认为目前的主要挑战是如何对原文本进行更好的向
文本风格转换旨在转换文本的风格,而不改变语义内容,是一种可控的文本生成任务,易与其他自然语言处理任务融合,具有重要的研究价值。由于缺乏内容相同而风格不同的平行语料,需借助无监督学习来实现文本风格转换。本文重点研究了基于风格联合表征与内容对齐循环重建的无监督文本风格转换方法。设计了基于对抗性变分自编码器的无监督文本风格转换模型。通过鉴别器与变分自编码器的对抗性训练,将源端句子的内容和风格在潜在空间进行分离,得到与风格无关的文本内容表示。将目标风格的表示和文本内容表示一起作为生成器的输入,从而生成目标风格的句
随着社会的快速发展,无线通信已经逐渐发展成为人们的基本生活需求之一。当前,无线通信系统采用跳频和直扩方式来抗截获以及抗侦收,随着截获能力和信号识别处理算法能力的提高,跳频和直扩方式抗截获以及抗侦收能力显得日益薄弱。跳相扩频调制能在不增加系统带宽的情况下,提高无线通信系统的抗检测性能、抗截获性能以及抗侦收性能。为了防止非合作方窃取有效的信息,服务于跳相扩频调制的跳相序列应该具有良好的随机性、复杂性和不可预测性。本文具体工作如下:
  研究了伪随机序列相关理论,跳相扩频调制方法。针对跳相扩频特点,提出了
低轨卫星通信在通信领域具有重要意义和广阔应用前景。本文重点研究了Polar码在低轨卫星通信中的性能,并在块衰落信道下提出了改进的极化重量构造算法,具有重要的理论与实际意义。
  本文根据信道传输特性随时间变化的快慢程度,将低轨卫星信道分为信道缓慢变化、固定周期缓慢变化和快速变化三种情况并分别建模为高斯信道、块衰落信道和Corazza信道。同时,在介绍了Polar码的基本原理和编译码算法的基础上,研究了Polar码的构造算法。在块衰落信道下,本文将衰落系数的作用看成是“衰落极化”的过程,提出了改进的极
科技的进步,推动社会的发展,为各行各业带来滚滚财源的同时,也使人们能享受越来越好的生活。在过去的20年间,科技上的进步带动经济高速发展,而人们,也因科技将生活变得更美好,当现代生活变得越来越复杂时,智能计算帮助我们化繁为简。至于未来,那些现在看起来是不可思议的事情,在将来或许就如电脑之于今天一样普通。  记忆,是个奇怪的功能,有些东西时间越久记忆越清晰,有些不久之前的事情,倒仿佛发生在遥远的上古世
期刊
图像表示是图像的基础,不同类型的表示以不同角度展示着图像的不同特征。例如,基于像素的表示直接地使用像素颜色、纹理或亮度对图像的每个像素进行表示,提供着图像的低层特征;而基于区域的表示则使用有意义的标签对图像的区域进行赋值,关注于图像的高层语义。某种意义上讲,图像处理和计算机视觉可以看作是对图像提取特征并将其转化为另一种图像表示的过程。
  最近的深度卷积神经网络使用着不同的图像表示进行监督,学习去解决不同的视觉任务。然而,本人发现,对于密集语义预测的任务,传统的图像表示通常忽略了像素之间的空间关系,