论文部分内容阅读
随着信息技术的发展,数字图像作为一种数字传播媒体在各行各业中被广泛使用,而随之发展起来的图像编辑软件使得越来越多的非专业人士能熟练地对数字图像进行编辑篡改,甚至没有留下任何明显的篡改痕迹。这些篡改图像的大量出现给司法、刑侦、名誉保护乃至社会稳定带来巨大的挑战,因此数字图像的取证变得愈加重要。针对数字图像取证问题,本文开展了以下三方面的研究:(1)现有的彩色图像拼接篡改检测算法通常将彩色图像的三个颜色通道分别处理,忽略了三个通道之间的相关性和整体性。因此,本文引入图像深度信息改进四元数彩色图像表示方法,然后定义了 RGB-D图像的四元数伪Zernike矩,并继而提取彩色篡改图像的四元数伪Zernike矩特征,最后结合四元数BP神经网络进行篡改检测。通过在四个公开数据集(DVMM,CASIA v1.0,v2.0,Wild Web)上的实验对提出算法在不同颜色空间上的性能以及现有七种篡改检测算法的性能进行了对比。(2)基于深度学习的拼接定位算法通过网络训练学习期望的特征,无需提取显式的特征。在现有基于深度学习的算法中,基于全卷积神经网络(Fully convolutional network,FCN)的算法可以实现像素级的篡改定位,但依然存在两点不足:(a)FCN对图像细节不敏感;(b)采用条件随机场(Conditional random fields,CRF)对FCN的定位结果进行后处理时与FCN网络的训练是分离的,难以实现两者同时最优。对于第一点,引入区域生成网络(Region proposal networks,RPN)增强FCN对于目标区域的学习;对于第二点,将CRF与FCN整合在一个端对端的学习系统中。最后综合考虑三种不同上采样倍数的FCN(FCN32,FCN16,FCN8)的结果。通过在三个公共数据集(DVMM,CASIA v1.0,v2.0)上的实验验证了算法的准确性、泛化性和鲁棒性。(3)以往的基于深度学习的图像篡改定位算法存在两点问题:(a)随着网络深度加深,网络的性能有时并没有提升,而且不易收敛;(b)仅考虑篡改图像本身和其残差这两者之一作为网络的输入。对于第一点,引入残差神经网络(ResNet)中的残差模块对FCN网络结构进行优化。对于第二点,将图像原图和图像残差分别作为网络不同分支的输入,在网络训练中综合考虑二者。在与(2)中相同的三个公共数据集上的实验结果表明所提算法在算法的准确性、泛化性以及鲁棒性方面均优于(2)中提出的算法。