论文部分内容阅读
图像作为对外界事物的客观描述,是现代生活中最常用的信息载体之一。图像处理技术在航空航天、工业检测等多个领域都有着重要的应用。视觉特征提取作为图像处理的基础,一直是研究者们重点关注的对象。生成模型学习输入数据的概率分布,能够将图像的本质特征描述出来,在各种应用场景中均取得了比手工设计的特征提取算法更好的效果。其中,传统的概率生成模型利用显式的函数模拟数据分布,函数的目标变量即为图像的特征。生成对抗网络能够将随机噪声映射到真实数据的分布空间中,得到高质量的合成图像,实现对数据概率密度的隐式表达。这两种生成模型都具有重要的研究与应用价值。本文首先详述了以专家乘积模型为代表的概率生成模型及其求解方法。由于生成对抗网络是基于深度学习的算法,本文分别对这两种理论进行介绍,作为之后研究工作的基础。对于图像版权保护问题,本文提出了一种基于多层生成模型的图像指纹算法。该算法利用一组专家函数将输入图像块映射为简短的特征描述符,并在目标函数中加入约束项以提高模型对不同视觉内容图像的区分性和对失真干扰的鲁棒性。算法采用均值池化去除特征图中的冗余,并将专家函数和池化级联构成一个特征提取模块。特征提取网络由多个模块堆叠组成,每个模块都在前一个模块输出的基础上提取更深层的图像特征。本算法在拷贝检测实验中实现了较高的准确率,优于其他对比算法。对于大规模图像检索问题,本文设计了一种基于生成对抗网络的图像语义哈希算法。该算法实现了一个以自编码器为鉴别器的生成对抗网络,并从编码器的输出结果中提取图像的语义哈希。算法根据图像的类别标签采用有监督的方式对网络进行训练。生成器经过学习能够将随机噪声映射为与真实图像类似的图像,可以用来对网络的训练数据集进行扩充。本文在MNIST和CIFAR-10数据集上对算法的性能进行了验证,实验结果证明算法在图像检索任务中表现良好。综上所述,本文在图像的版权保护和检索两个应用场景下,分别利用概率生成模型和生成对抗网络设计特征提取算法,并取得了较好的结果。