基于生成对抗网络的跨模态图像生成研究

来源 :北京交通大学 | 被引量 : 0次 | 上传用户:yangdinghui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像生成问题作为机器学习领域的一个重要问题,近年来更是随着生成对抗网络的兴起而吸引了越来越多的研究关注,这种生成式模型除可以直接用作于对某些缺失数据的增补、产生接近真实的数据之外,也可以用于诸如验证模型对于高维概率分布问题表达能力、处理多模输出问题以及用于强化学习等。常规的单模态图像生成任务基于随机噪声或者基础图像的输入,通过条件变量的控制实现朝着一种或者数种固定模式的方向变换,然而借由这种方式训练得到的网络在一定程度上限制了网络本身的生成能力,相比之下,文本信息的引入则可以为网络带来更大的灵活性,通过将语义信息与图像特征进行关联,进而借由文本输入的改变来实现生成图像的变化。较之于传统单模态的图像生成而言,除了对跨模态信息的使用网络构建外,这种跨模态的语义图像生成问题中还存在着如何将文本和图像两种不同模态数据进行相互映射的问题。同时在现有跨模态图像生成中,尤其是文本引导的图像修改任务中还存在着诸如生成图像质量不高、分辨率较低的情况,为此本文针对现有文本引导的图像修改任务相关研究方法中的不足,提出新的解决方案,主要工作和贡献如下:首先,提出了新的渐进式跨模态图像生成网络模型。现有研究方法中对于网络的生成器部分均采用直接将原始图像中提取的视觉特征与语义特征简单拼接后再进行转换的方式实现,而对鉴别器则采取不同的损失函数设计,借以增强两种模型间的对抗训练过程、提升生成模型能力。而随着图像分辨率的提升,这种对抗性的网络训练也将变得更加困难,为此我们考虑采用渐进式的生成方式从低分辨率图像的生成开始,借由提出的联合模块实现在逐级对图像内容进行修改的同时也为其引入更多的原始细节信息。为验证本文中所提出网络模型的效果,我们还在细粒度图像数据集CUB-200-2011上进行对比实验,对所提出网络的有效性进行验证。其次,针对当前条件下图像数据丰富而与图像相匹配的细粒度视觉描述的文本数据紧缺的情况,本文中对所使用的统一跨模态视觉语义嵌入模型结合双线性注意力池化方法进行改进,在增强对细粒度描述的视觉特征与语义特征的映射关系建立的同时减少这一过程中来自于背景图像的干扰,从而使得网络可以在一定程度的小样本条件下仍能正确地根据语义信息实现相应的图像生成效果,此外为了对改进后的模型效果进行验证,本文中还将其与原始方法进行了详细的比较,充分验证了改进后方法的优越性。
其他文献
二十世纪四十年代,由于工业化和城市化以及能源开发的需要,钢筋混凝土构件被最大限度地应用在海岸与近海结构工程中,由于长期在具有于海水腐蚀、干湿交替和循环荷载的严酷环境下,最终因钢筋的侵蚀导致结构的严重损伤。以至于在海浪的循环荷载作用下发生疲劳破坏,影响了结构的使用寿命。腐蚀疲劳是引发耐久性问题的重要原因,得到了高度的关注。目前该领域的研究资料不够充分,对于腐蚀疲劳发展规律的研究等,应处于资料不完善的
培养学生工程问题解决能力是工程教育的核心任务,是工程教育认证的毕业要求。然而,根据教育部高等教育教学评估中心的调查显示,工科学生解决工程问题的能力仍然偏弱,这是工程教育今后要解决的一个主要问题。研究表明,解决工程问题时所运用工程技能、经验、直觉和工程伦理等方面大多属于默会知识的范畴,其习得和传递方式依据默会知识的规律而进行。因此,提高工程问题解决能力,必须增强默会知识的传习。本文以提高工程问题解决
粘胶纤维是一种优质再生纤维素纤维,具有光滑、凉爽、透气、抗静电和抗紫外线等优异性能。粘胶纤维的原料即纤维素来源丰富,其纺织制品被广泛应用在日常生活中。然而,粘胶纤
文学作品一直是对外汉语教材中课文选编的主要来源,特别是在中高级对外汉语教材中。然而,近年内对教材中选取的文学作品系统研究却很少。根据之前的研究,本文归纳出语言教材
当前,全球信息化浪潮汹涌,世界各国都把推进数字化、信息化建设作为实现社会创新发展的重要动能,信息技术的高速发展引发了各部门、各环节的管理技术革命,其中也包括政府部门
目的:研究分析早期手术与延期手术对可切除性肝癌破裂出血患者术后预后生存、术后复发及腹腔转移的影响,以期在临床上为原发性肝癌自发破裂出血患者的手术时机选择上提供一定参考。方法:总结2012年1月-2017年12月于我院行手术治疗的52例HCC自发性破裂出血患者的临床资料。依据发病至手术的间隔时间,将发病1周内(≤7天)行手术治疗的患者纳入早期手术组,将发病1周后(>7天)行手术治疗的患者纳入延
国务院总理李克强在2016年所作的《政府工作报告》中首次提出“工匠精神”一词。随后在2017年,总理又进一步强调“要大力弘扬工匠精神;厚植工匠文化,恪尽职业操守,崇尚精益求
近年来,随着科学的不断发展,随机微分方程理论逐步建立起来。而随着对自然认识的不断加深,人们逐渐发现一般的随机微分方程不能够满足一些特定的生产生活场景。例如对于一些
岸边集装箱起重机(也称岸桥)是港口集装箱装卸的主力设备,随着岸桥不断向大型化发展,岸桥在遭受地震时更容易破坏。目前对于岸桥的地震响应分析方法缺少系统性的研究,并且现有地震工况设计方法简单,按照现有地震工况设计的岸桥偏重,导致平时运行维护成本提高。本文以岸边集装箱起重机为研究对象,采用有限元仿真与振动力学模型相结合的方法,对岸桥结构在不同水准地震作用下的弹性响应特性、弹塑性响应特性及抗倒塌能力展开了