论文部分内容阅读
人的视觉注意力机制使得每个人都能在复杂的环境中快速地找到我们最感兴趣的部分,也就是最显著的部分。显著目标检测就是在这一研究的基础上,利用计算机来模拟人的视觉注意力机制,从而快速地找到图像中的显著区域。显著目标检测可以作为图像预处理工作,应用在许多计算机视觉领域,比如图像或视频分割、物体定位以及弱监督学习等。目前显著目标检测主要分为两个方向。单幅图显著目标检测与协同显著目标检测。协同显著目标检测区别于单幅图显著目标检测的地方在于,单幅图显著目标检测旨在检测出单张图像中的显著区域,而协同显著检测旨在检测出一组图像中共同显著的区域。通过协同显著检测可以将一组图像划分为共同显著部分和其他非协同部分。而随着众多测距设备的发展和普及,深度信息逐渐被应用在计算机视觉领域,针对RGB-D图像的显著目标检测方法的研究也受到了许多人的关注。因此根据检测图像的不同,单幅图显著目标检测又可以分为RGB图像单幅图显著目标检测与RGB-D图像单幅图显著目标检测。同样的,协同显著目标检测也可分为RGB图像协同显著目标检测与RGB-D图像协同显著目标检测。本文的工作主要聚焦于RGB-D图像的协同显著目标检测。本文提出了一个基于协同元胞自动机的RGB-D图像协同显著检测模型。首先,本文利用现存的单幅显著图作为初始图,并且提取图像超像素级别的颜色、深度特征,同时考虑到深度学习网络在计算机视觉领域的显著作用,本文利用一个深度学习网络提取出图像超像素级别的高维语义特征,然后结合初始显著值、颜色、深度以及高维语义特征找到图像间超像素的一致性关系;其次,本文引入元胞自动机模型并加以改进,将图像间一致性关系强的超像素作为新邻居,并且在计算超像素之间权值时加入深度值的对比;最后,利用该模型对现存的单幅显著图进行优化得到最终的结果。本文的上述工作中利用人为设计的线索,提取了颜色、深度、初始显著值以及高维语义特征这四种类型的特征进行协同显著目标检测。然而,由于不同组之间的图像相差甚大,有些组的图像对深度信息敏感,有些组的图像对颜色信息敏感,一个统一的人为设计的线索可能无法适用于所有的图像组。因此本文希望通过特征选择的方法对不同组的图像选择各自敏感的特征用来进行协同显著检测,从而达成更好的效果。因此,本文结合智能优化计算领域的粒子群算法(PSO),提出了一个基于PSO特征选择聚类的RGB-D图像协同显著检测算法。首先,根据RGB-D图像单幅图显著的初始显著图选择出候选显著区域,然后提取出这些候选显著区域24维超像素级别的特征;其次利用基于PSO特征选择的聚类算法生成粗协同显著图;最后本文引入了EMR算法对粗协同显著图进行进一步的优化并同粗协同显著图融合得到最后的结果。本文在RGBD Cosegl83和RGBD Cosa1150两个公开的数据集对本文所提出的两种RGB-D协同显著目标检测方法进行实验,与其他的几个主流方法进行了对比。实验结果表明本文方法同其他经典的方法相比,无论是PR曲线还是F-measure值,都有较大的优势。