感知组织在图像显著性及视觉注意力预测上的应用

来源 :复旦大学 | 被引量 : 0次 | 上传用户:colinqq1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
感知组织包括感知分割及前背景组织,在人类视觉认知过程中起到一个基础且承上启下的作用。其中,感知分割的作用是将从视网膜得到原始图像信号及物体边缘轮廓信息加以处理从而形成区域的概念;前背景组织进一步将之前得到的区域划分为前景及背景两类,从而大大简化之后物体识等过程的复杂度。通过认知心理学家几十年的研究,已经发现了一些感知组织特征,包括凸性、对称性、包围性、方向性等,在前背景组织过程中起到决定性的作用。其中,凸性意味着若在两个区域交界处存在一条分界线,则拥有凸出边界的区域更容易被认知为前景;对称性表示一个高度对称的区域具有更大的可能性是前景;包围性则表明一个被其他区域完全包围的区域更有可能是前景。我们可以将上述线索应用到多个计算机视觉任务中,包括前背景分割、显著性检测、预测注意力选择等。本文中,我们提出一种自动检测图像凸性的算法,并在真实图像集合上进行验证。通过实验发现,我们提出的凸性检测算法不仅仅在人工环境的认知心理学实验中符合已有结论,而且在自然图像集合上也是有效及具有区分力的。于是,在图像显著性检测任务中,本文使用凸性检测算法结合层次化多分割模型建立一个无向带权图,并通过不同层次上凸性上下文窗口的叠加进而调整节点之间的权重,并使用一个图分割算法得到显著性检测结果。另外,在预测视觉注意力选择任务中,通过计算图像的凸性、对称性及包围性,本文提出一种获取图像前景分布图的方法,并结合自底向上的图像底层特征显著性及自顶向下的物体检测特征,最终通过一个基于层次化多分割及随机游走的推断模型得到视觉注意力分布图。在实验部分,针对上述两个任务本文分别对提出的算法及模型进行验证并与同类算法进行比较。实验证明,基于感知组织的显著性检测方法与目前主流的基于图像底层特征的检测方法性能接近。另外,在引入前背景分布图及新的推断模型后,视觉注意力预测准确率也得到了相当的提升。本文的研究旨在证明认知心理学在计算机视觉中占有相当重要的地位。
其他文献
异构计算以其较高的峰值性能和较低的能耗成为当前研究的热点。随着GPU在通用计算领域的成功,Intel也推出了基于Intel Architecture(IA)架构的MIC(Many Integrated Core)协处
本文主要研究IPsec协议簇中的IKE协议部分,提出将ECC、PKI、RBAC访问控制技术同IKE协议结合起来,设计一个增强的基于PKI身份认证和访问控制的IKE协议。设计并实现了这个IPsec
  目前,很多公司提出了自己的分布式防火墙的策略和实现方案,这些防火墙认为网络外部的人是不可信任的,网络内部的人也是不可信任的,所以在实施时每个客户端都需要执行严格的安
  本文研究了计算机服装仿真中力学模型的建立和实现。提出了缝合检测算法,提高了仿真的速度,同时避免了缝合过程中的出错状况。提出了人体着装后受力分析模型。此模型采用有
电信综合网管系统的目标是要最大限度地利用电信网络资源,提高网络的运行质量和效率,向用户提供良好的通信服务。这需要集成不同类型的网络环境,采用先进的计算机网络管理技
互联网的发展使得因特网成为当今社会的主要信息交流平台。由于网络用户激增,网络应用层出不穷,接入国际互联网的带宽似乎永远不够用。但是从网络管理的角度来说,网络带宽资源只
随着数字校园现代化建设的不断发展,文件的数量和访问量不断上涨,传统的文件存储系统正逐渐被分布式云存储系统所取代。分布式云存储系统可以有效地解决数字校园环境下大容量
本文介绍了将一个基于数据库的文件系统移植到Linux 操作系统上的设计与实现,该方案在不改变传统文件系统的命令访问接口和应用程序接口基础上,使用兼容POSIX 标准的接口,为
随着多媒体数据(图像、视频和音频)的爆炸式增长,人们急需一种能够方便多媒体数据库管理和访问的技术,基于内容的多媒体检索(CBMR)应运而生。基于内容的图像检索(CBIR)是CBMR的
由于各种数字视频的应用,都对视频图像的质量有不同程度的要求,而在很多情况下,由于拍摄环境与条件的限制,获得的视频图像会产生抖动与信息丢失等现象,给观测者和后期处理带