论文部分内容阅读
随着近年来硬件性能的提升和神经网络的发展,生成对抗网络的研究进入了高峰,各种思想和应用方案给GAN注入了持久的活力。GAN在图像领域效果优异,但不可否认的是它依然存在许多难以解决的问题,其中模式崩溃的问题尤其引人关注。模式崩溃问题表现为两种形式,第一种表现是样本的多样性不足,第二种是生成样本无意义。模式崩溃问题阻碍了GAN的进一步发展和应用。本文提出了基于分类增强的生成对抗网络的改进模型,在解决模式崩溃的问题上取得良效。改进模型基于Wasserstein距离度量分布距离,应用卷积神经网络作为网络结构,并引入分类器对判别过程起到辅助作用。改进模型的训练过程分为预训练阶段和混合训练阶段,在预训练阶段训练分类器对样本图像的分类能力,在混合训练阶段分类器基于对样本的分类结果在判别器损失的基础上施加惩罚。而判别器和生成器在两个阶段均进行对抗训练。改进模型的判别器的损失函数由原始GAN损失函数、梯度惩罚、分类器关注度惩罚和复杂度惩罚构成。关注度和复杂度取决于分类器对生成样本的分类结果,其中关注度取自生成样本在分类中的概率峰值与关注度阈值的差值,它可以约束生成器的梯度变化方向,鼓励生成与真实样本相似度更高的样本;复杂度取自生成分布的信息熵,它以分布的复杂性作为反馈,鼓励生成更多样的样本。通过上述两个惩罚项,改进模型针对模式崩溃的两种问题提升了模型的性能。我们通过训练收敛速率、生成样本与真实样本的相似度、生成图像的质量和生成分布的复杂度这些指标来评估模型的性能。在CIFAR-10和CELEBA数据集上的实验结果证实了我们的猜想,即改进模型在付出较小时间代价的情况下,生成质量、样本真实度和多样程度上的性能有所提升。我们另外设置了梯度惩罚参数、关注度阈值、关注度惩罚参数和复杂度惩罚参数这四组对比实验,以获取改进模型的全局最优状态。