论文部分内容阅读
注意是一个多学科交叉的研究领域,近年来受到从事神经生理学、认知心理学、计算机视觉和计算神经科学研究的科技人员的高度关注。注意是在来源不同的各种信息同时出现时做出选择的一种认知层面上的处理过程。由于注意能提高视觉信息加工中的检测能力和响应速度,尤其是基于目标的注意能够直接为图像理解提供对象,因此,构建注意的计算模型成为一个热点课题。然而基于目标的注意理论面临着一个关键问题,就是感知目标的定义和获取,而对感知目标的获取对应着视觉感知中的知觉组织过程,因此研究知觉组织的生理和心理机制,设计高效又鲁棒的感知目标获取方法,是构建基于目标的注意计算模型迫切需要解决的问题。将认知心理学中的格式塔学派的研究成果,转化为计算模型是知觉组织算法研究的突破口。统计学、图谱理论和信息论是分析高维数据的全局结构和拓扑关系的更合理的方法和手段。
本文是在系统水平上,以格式塔学派强调的由局部到整体的研究成果为依据,以统计学和信息论探索周围世界视觉图像的统计特征的已有进展为理论基础,从模拟视—脑信息处理方式出发,构建计算模型。研究的内容主要分为两大部分。第一部分提出自底向上的轮廓编组模型以及在此基础上的基于目标的注意,从而体现了视—脑初级阶段的信息加工过程。通过分析人脑所接受的外界信息的统计特性,提出了合理的格式塔知觉组织规则的量化模型,并构造了全局显著结构主导下的轮廓编组模型,其有效性在多类自然图像中得到了验证。第二部分提出利用先验知识的轮廓编组模型,体现了视—脑高级阶段的信息整合过程,通过模拟视皮层的短程连接构建反映整体结构分布的描述子,模拟长程连接建立待编组目标与先验目标之间的通信,实现了对较复杂图像的轮廓编组。本文的主要创新点有:
1.提出了格式塔知觉组织规则的量化模型。分析人类视觉神经系统所感知的外界信息的统计特性,对格式塔知觉组织规则中的接近律、相似律和连续律分别进行了建模,并用基于信息几何的模型选择准则选择合适的模型,提高了单个知觉组织规则模型的准确性和泛化性;研究了各规则之间的相互关系,包括是否独立和对知觉组织的贡献程度。与相关心理学实验数据的比较说明了所建模型的合理性。
2.提出一种全局显著结构主导下的轮廓编组模型GSSD。用概率推理的方法描述了全局显著结构—闭合性,并以此为线索通过非划分的迭代方法寻找感知目标对应的轮廓编组;给出了轮廓编组在流形下的诠释,提出基于流形的轮廓编组算法,说明作为编组依据的全局显著结构是低维、有序、稳定的结构,与认知心理学相符。实验结果表明,GSSD模型具有较理想的精度,较好的鲁棒性和较高的计算效率。
3.提出了基于目标的注意计算模型。在轮廓编组的基础上实现了自底向上的基于目标的注意模型,通过与基于空间的注意的对比,说明基于目标的注意更适合检测、识别等中、高级视觉任务。实验结果表明,该模型对成像条件较好的图像的注意结果与人类感知接近,这与自底向上的注意机制相符。
4.提出利用先验知识的轮廓编组模型。模拟短程连接构建了基于响应差异的全局结构描述子,模拟长程连接建立了待编组目标与先验目标之间的通信,并将最大化编组与先验图像的局部灰度特征间的互信息作为补充优化目标,以解决仅凭全局形状特征所不能解决的鲁棒性问题—存在较大形变的形状间的匹配。实验结果表明利用先验知识的轮廓编组对背景较为杂乱、局部遮挡或重要边缘缺失的复杂图像具有一定的鲁棒性。