论文部分内容阅读
长期以来,计算机视觉一直是神经生物科学、心理学和人类感知方面的探索热点。主要指的是在早期视觉处理阶段上,低层次的测量刺激人眼的注意。我们意识到,早期人们看见一张图片时把预测显著性当成一项任务,近年来,已经延伸到物体水平上的显著性检测,将显著物体从背景分离开来。研究的热点侧重于物体级的模型检测研究,比如物体检测和识别,图像检索和分类,内容感知等等。2D显著目标检测:为了在二维RGB图像上进行显著物体检测,大多数现有的算法可以分为两种:局部和全局。局部的检测方法通过测量特定窗口中的区域相对于其邻域的稀少性来检测目标。Itti等人首先提出关于图像的计算机视觉研究机制。并研究出关于特征值的计算中心-领域差异性的的算法。Harel等人研究一张图在图片中采用随机行走计算显著值。为了突出整体的前景目标,使用多尺度的对比算法以及多角度进行融合的方法。局部对比方法缺少全局关系和结构,对高频内容和噪声比较敏感。全局方法通过图像的整体稀疏性来估算图像区域的显著性大小。Achanta等人通过计算RGB彩色图像中关于像素水平上颜色差异性得到目标显著性。然而这个定义只占1%的颜色平均值,在复杂背景下容易导致性能下降。Goferman等人通过低层次角度和全局关系为背景,提出了改进的突出显著目标检测的方法,设计一个全局对比模型,计算三维图像之间的不同点。3D显著目标检测:与二维显著性研究的进展相反,获取深度信息的限制给研究带来了限制。Niu等人使用双目图像估算视差图,且仅仅使用深度数据来进行显著目标的识别。因而其检测结果依赖于视差图估算的质量,对后续计算机视觉的研究存在一定的阻碍。随后Lang等人收集了 600张RGB和RGB-D图像,在其中进行了比较研究二维和三维场景中,眼睛固定的预测,而不是物体的预测。随着计算机视觉得到很多专家和学者们越来越多的重视和兴趣,深度信息被证明其三维布局和形状特征在视觉研究中带来更多的图像信息,具有有效性。依据Kinect主动距式传感器的生产水平的提高,使用设备获得RGB彩色图和深度信息的也变得越来越方便,研究者们和专家们进而转向对三维图RGB-D进行显著目标检测的关注和探索也越来越多。而大部分显著性检测的工作侧重于2维图像上方法的研究,并没有很好的利用深度信息RGB-D的显著性方法。本文首先提出了融合显著深度特征的RGB-D图像显著目标检测的方法。该方法首先对原始深度图进行了预处理得到深度显著图。将其和颜色特征一起结合成综合特征,具体预处理包括以下方面:背景顶点区域、构图交点、紧密度的多角度融合形成深度显著图;其次,从前景角度,将综合特征通过边连接权重构造关联矩阵,根据构图先验,假设多层中心矩形为前景种子,通过流形排序方法计算出RGB-D图像的前景显著图;从背景角度,根据背景先验以及边界连通性计算出背景显著图;最后,将前景显著图和背景显著图进行融合并优化得到最终显著图。本文随后提出了深度显著图增强RGB-D图像的显著目标检测的方法。该方法首先使用LBE局部封闭的方法预处理深度图,并将其为特征来加强RGB-D图中RGB彩色图的流形排序得到RGB彩色图的显著图;利用来指导深度图的流形排序得到;最后将RGB彩色图的显著结果图和Depth深度图的显著结果图两者融合得到RGB-D图的显著结果图。本文在两个公开的数据集RGB-D1000和NJU-DS2000上进行了对比实验。实验对比发现,本文提出深度显著图的方法可以明显地增加检测效果。本文最后提出了融合显著深度特征的RGB-D图像显著目标检测的方法—在人脸检测方面的应用。该方法是将第一部分提出的RGB-D显著目标检测的方法得到显著图作为输入图,来进行人脸检测得到目标的过程。实验根据手工收集RGB-D图像中显示出人脸的数据集,实验对比待检测的RGB彩色图为输入图进行人脸目标的检测,实验结果证明了该应用的实用性和可操作性,对于原始图片的检测结果可以得出结论:提高人脸检测的准确率和并减小了误检数。