【摘 要】
:
由于强大的特征学习和特征表达能力,GAN在文本生成图像领域获得了巨大成功。虽然GAN具有很高的研究价值,但由于文本句子向量缺少在词语层面上的微度调整信息和对文本的理解,
论文部分内容阅读
由于强大的特征学习和特征表达能力,GAN在文本生成图像领域获得了巨大成功。虽然GAN具有很高的研究价值,但由于文本句子向量缺少在词语层面上的微度调整信息和对文本的理解,有时生成结果与预期存在较大偏离。为了解决这种问题,相关学者提出了 AttnGAN,在GAN的理论基础上,模型添加Attention机制,实现细粒度化的单物体文本描述生成图像。本文首先详细介绍了基于AttnGAN的文本描述生成图像模型,并综合场景图图像生成算法,提出了基于AttnGAN模型的文本生成多对象图像算法SG-Attn。基于大量实验分析,SG-Attn达到了基于文本描述生成多物体图像的目标。本文主要创新点为:1.提出了 SG-Attn模型。SG-Attn可以根据文本描述获得其中的实体及实体间的位置关系,进而生成对应文本描述的场景图。场景图作为代替自然语言描述条件语意的算法输入参数,从而使得算法模型更好地学习对象间的位置关系特征,最终实现生成的图像中包含更多细节特征以及更准确的实体位置关系的目标。2.使用Qt Designer和PyQt工具包开发一个基于SG-Attn生成式对抗网络的文本描述生成图像系统,该系统实现了通过文本描述来生成图像的主要功能。此外,系统还提供了调参功能、生成结果可视化功能等。就用户视角而言,该系统实现了算法模型的个性化定制以及操控化训练,进而基于算法模型,进行文本生成图像的针对性应用。
其他文献
非饱和黄土大量存在于中国西北地区,基于黄土特殊的物理力学特性和在工程实际应用中的不可避免性,对非饱和黄土的研究是非常有必要的。本文取兰州非饱和黄土为研究对象,在夏
目标跟踪技术已经在军事安全、轨迹动态分析、场景识别等领域取得了一定的成就。其核心思想是利用模型学习连续视频的第一帧的信息,然后在接下来的复杂连续帧中识别并定位目
异形柱(specially shaped column)是异形截面柱的简称。这里所谓“异形截面”,是指柱截面的几何形状与常用普通的矩形截面相异而言。异形柱是指截面几何形状为L形、T形和十字
近年来,多智能体系统(Multi-Agent Systems,MASs)的一致性作为协同控制的基本问题成为了控制科学范畴内的一个重要研究对象。同时,系统的开放共享性给多智能体系统的安全问题
云是由水汽凝结而成的悬浮于大气中的细小水滴或冰晶组成的可见聚合体。云的辐射强迫对地气系统的辐射收支起着重要影响,准确获取云的光学和微物理特性及其时空分布对于研究
变电站是电力系统中的重要组成部分,是生命线工程中的关键一环,肩负着重大任务。从近些年来国内外发生的破坏性地震引起的变电站震害来看,高压电气设备遭受的破坏严重,导致周
近年来,机器学习极大地提升了图像识别能力。然而研究表明即使决策可靠的深度神经网络模型也容易受到对抗性攻击的影响。通过向合法样本添加微小扰动形成的对抗样本使模型产
整体式固体火箭冲压发动机作为一种新型的导弹推进系统,以其体积比冲高、推力系数大、易于小型化、使用维护性好等优点,可最大限度地满足新一代战术导弹的战术技术要求,通过
活性粉末混凝土这一高性能材料在桥梁工程中的应用实例越来越多,但活性粉末混凝土的高性能需高温养护才能实现,这也决定了其在桥梁工程中多应用于预制桥梁。在预制拼装桥梁中
随着电子商务的飞速发展,快递行业迎来了新的机遇,而城市配送作为快件物流配送中的重要环节将直接影响整个快递配送效率。针对目前城市快件配送服务多主体、配送资源碎片化、