论文部分内容阅读
选择性注意是人类感知系统从外部环境中获取感兴趣信息的重要生理机制,也是对大脑有限的信息处理资源进行高效应用的重要步骤。在计算机视觉研究领域,通过模拟人类视觉系统的选择性注意机制,可以使计算机完成一些在复杂场景中提取感兴趣信息的任务。人眼在场景中进行扫描时根据视觉刺激的显著性来转移注意力,而视觉刺激的显著性不仅来自于视觉刺激本身,也来自于人类大脑的影响和控制。在视觉注意机制中,这两类因素分别被称为自底向上信息和自顶向下信息。相应地,模拟这两类因素引导视觉注意力的模型分别被称为数据驱动、自底向上类视觉注意模型和任务引导、自顶向下类视觉注意模型。本文对这两类模型中具有代表性的模型进行了研究。根据目前认知神经科学领域的不同理论和观点,相应的自顶向下类视觉注意模型的研究出现了较多的分支和方向。然而,现有的此类模型均存在一定的局限性,与人眼的生物行为学实验结果并不一致。本文主要研究如何在自顶向下视觉注意模型中引入更全面的给定目标的知识,并提出一种基于目标结构化表示的视觉注意模型用于在场景图像中关注复杂目标。新模型通过对给定目标的图像进行学习,提取显著性图斑并使用图斑组成的图结构表征目标知识,在视觉注意的过程中引入该知识,使得注意焦点更快地在场景中关注到目标。在新模型中,基于“秩相关”的理论和计算方法提出了一种图斑特征编码方式及其相似性度量方法;采用一种改进的简化邻接表的方式表征图斑组成的图结构;设计了一种图斑搜索及合并策略来模糊匹配图斑组合,通过合并与目标知识相似的图斑组合来输出注意焦点区域。实验表明,新模型可以通过学习有效地引入复杂目标的多元特征显著信息和结构信息,降低无效关注次数,提高视觉注意的效率,更完整地关注到复杂目标。新模型可以应用于在自然场景图像中快速定位复杂结构目标的任务中。