论文部分内容阅读
感知组织包括感知分割及前背景组织,在人类视觉认知过程中起到一个基础且承上启下的作用。其中,感知分割的作用是将从视网膜得到原始图像信号及物体边缘轮廓信息加以处理从而形成区域的概念;前背景组织进一步将之前得到的区域划分为前景及背景两类,从而大大简化之后物体识等过程的复杂度。通过认知心理学家几十年的研究,已经发现了一些感知组织特征,包括凸性、对称性、包围性、方向性等,在前背景组织过程中起到决定性的作用。其中,凸性意味着若在两个区域交界处存在一条分界线,则拥有凸出边界的区域更容易被认知为前景;对称性表示一个高度对称的区域具有更大的可能性是前景;包围性则表明一个被其他区域完全包围的区域更有可能是前景。我们可以将上述线索应用到多个计算机视觉任务中,包括前背景分割、显著性检测、预测注意力选择等。本文中,我们提出一种自动检测图像凸性的算法,并在真实图像集合上进行验证。通过实验发现,我们提出的凸性检测算法不仅仅在人工环境的认知心理学实验中符合已有结论,而且在自然图像集合上也是有效及具有区分力的。于是,在图像显著性检测任务中,本文使用凸性检测算法结合层次化多分割模型建立一个无向带权图,并通过不同层次上凸性上下文窗口的叠加进而调整节点之间的权重,并使用一个图分割算法得到显著性检测结果。另外,在预测视觉注意力选择任务中,通过计算图像的凸性、对称性及包围性,本文提出一种获取图像前景分布图的方法,并结合自底向上的图像底层特征显著性及自顶向下的物体检测特征,最终通过一个基于层次化多分割及随机游走的推断模型得到视觉注意力分布图。在实验部分,针对上述两个任务本文分别对提出的算法及模型进行验证并与同类算法进行比较。实验证明,基于感知组织的显著性检测方法与目前主流的基于图像底层特征的检测方法性能接近。另外,在引入前背景分布图及新的推断模型后,视觉注意力预测准确率也得到了相当的提升。本文的研究旨在证明认知心理学在计算机视觉中占有相当重要的地位。