基于生成对抗网络的文本生成图像研究

来源 :湖南师范大学 | 被引量 : 1次 | 上传用户:wendy_83090905
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本生成图像是一项能够将一段描述性的文字转化成图像的技术,这不仅要求计算机理解文本所表达的语义信息,还要根据语义信息转化成与之匹配的图像信息,这是一个非常具挑战性的任务。但是近几年来,随着生成对抗网络的迅猛发展,其强大的无监督样本生成能力迅速获得研究者的青睐,其独特的对抗思想比传统机器学习算法具有更加强大的特征学习和特征表达能力,使得生成对抗网络被广泛应用于自然语言领域和视觉领域等其他各种领域,这些都为文本生成图像这一任务的实现提供了基础。为了进一步提升文本生成图像的质量,本文在现有文本生成图像模型Stack GAN-v2的基础上进行改进,本文的创新点如下:(1)针对传统的生成对抗网络中受卷积运算的局部感受野限制,模型不能很好的处理长范围、多层次的依赖关系,提出了结合自注意力机制的堆叠式生成对抗网络,让模型能够使用所有位置的细节线索来协调各个位置的细节特征,同时在生成器中引入特征重构损失来保证生成样本和真实样本语义上的相似性,最后针对原网络模型的训练不稳定问题,在判别器中引入谱归一化,通过限制判别器每一层网络的权重矩阵的谱范数来约束判别器的利普希茨常数,从而提高模型的稳定性。(2)针对原模型生成的高分辨图像缺乏细粒度细节问题,提出了结合类别多目标损失堆叠式生成对抗网络。在原模型中引入图像类别损失,让模型能够自动学习同类图像所具有的相似特征,在一定程度上能够弥补一些难以捕获的高分辨率图像的特征信息,并对原模型的无条件损失判别器进行改进,让输入为低分辨率图像分支的判别器关注图像的全局结构,而输入为高分辨率图像分支的判别器则关注图像的局部的细节,同时为了防止最后生成的高分辨率图像出现全局变形问题,在生成器中引入像素损失。
其他文献
多基色无荧光粉LED以其高品质、高可靠性的优点成为下一代半导体照明的必然趋势。对于多基色LED封装模块,光提取效率和空间颜色均匀性是评价其性能的关键指标之一。传统的封
本文以丹尼爾·裡希特(Daniel Richter, 1962-)從1999年到2012年之間的具象作品為研究物件,筆者從畫面的風格角度,構圖,藝術語言這三個方面進行分析,藉以探討這位藝術家的獨
背景神经元增殖和分化障碍影响创伤性中枢神经系统损伤后的修复和再生,进一步会产生各种各样的神经系统疾病。前期实验结果证明PTEN沉默会促进PC12的增殖和分化,提示PTEN可能
电力系统运行时用户侧负荷不平衡现象时有发生,如何解决由此导致的系统参数不平衡、供电电压质量变差、功率因数降低等问题是当代学者研究的课题,随着工业发展,大负荷投入带
USB通用串行总线作为一种标准高速串行总线接口,其极高的数据传输速度,能满足许多高速数据传输的应用环境需求,而且因其兼有供电简单、连接方式灵活、兼容性好、支持热插拔等
海上或空中进行分布式雷达组网通常只能依靠无线通信。由于战场复杂电磁环境的影响,无线通信的符号错误概率通常会高达10-2。为了实现信息的可靠传输,通常采用信道编码和重传
随着我国智能制造业的改造升级,工业机器人需求剧增。人机协作是机器人发展的重要特征,车间中各种类型机器人与人协同工作,处于弱势地位的工人安全隐患相对较大。据美国劳工
聚醚砜(PES)具有机械稳定性、化学稳定性、耐热性、耐腐蚀、抗氧化、耐氯、耐有机溶剂、耐热等优良性能,常作为超滤、纳滤膜的材料。同时由于聚醚砜有着十分优异的生物相容性
激光多普勒测速是一种利用光学多普勒效应的进行速度测量的先进技术,相比于传统的测速手段,例如加速度计、GPS等,激光多普勒测速具有测量精度高、响应速度快、测速范围广且非
随着社会进步和科学技术的发展,传感技术得到了广泛的应用。超弱光纤光栅(Ultraweak FBG)作为光纤光栅传感光纤传感领域的新的类型,具有对光信号传输时损耗小、机械强度高、