论文部分内容阅读
注意是人类信息加工过程中一项重要的心理调节机制,它能够对有限的信息资源进行加工分配,使感知具备一定的选择能力。人类视觉系统这种在面对复杂场景时,能够迅速将注意力集中在少数几个显著的视觉对象上的过程被人们称为视觉注意选择。视觉注意机制的研究,不但有助于探索人类视觉信息处理的工作机理,而且在图像分析领域中也有重要应用价值。如果能够将这种视觉注意机制引入到图像分析领域,将计算资源优先分配给那些容易引起观察者注意的图像区域,那么必将极大地提高现有图像分析方法的工作效率。本文主要研究如何设计一种实用的引入选择性注意机制的视觉显著性区域检测算法;如何在注意焦点的引导下对图像重构;如何将注意机制引入到特定图像(人脸)的识别和视觉搜索中。概括而言,本文的主要研究工作包括:1.基于人类视觉系统尺度选择的特点,提出了一种通过对图像的频域特征进行多尺度分析来计算显著性的方法。生理学上的实验证明人们对不同频率视觉信息的敏感阈值不同,此阈值可以用对比度敏感函数(Contrast Sensitive Function,CSF)表示。本文首先将人眼真实视点在图像尺度空间进行统计分析,得到更加准确的敏感度曲线,并得出人类视觉系统对中低频信号更加敏感。结合这一曲线,本文利用高斯带通滤波器对图像中的各频段赋予不同的权值,以此计算图像的显著性区域。图像和视频中的实验证明了本方法的优越性,尤其是对于复杂重复性纹理场景下的显著性检测具有更好的结果。本算法时间复杂度低,对图像和视频的处理速度快,并且检测效果较好。2.目前大部分流行的人脸表示法都是基于均匀网格采样,然而能够提供判别信息的只是人脸中的一小部分区域。心理学家研究表明,人类视觉系统通过视网膜的空间变换采样和视点的非均匀分布对不同的人脸区域赋予不同的权重。本文通过视点及其视网膜成像对人脸图像进行重构。通过对图像的不同区域采用不同的高斯平滑算子来平滑。并通过分析人眼真实视点、计算模型产生的注意焦点、随机产生的点及均匀网格采样这四种不同的焦点源对人脸图像重构的效果,验证了非均匀分布的视点对于重建人脸区域的有效性,给后续的人脸识别算法提供了有力的证据。3.心理学实验表明,对于一幅输入图像,在人们关注局部区域之前,人类视觉系统首先会有一个全局的认识,然后视点会相继落在比较感兴趣的区域(局部)。本文通过模仿人类系统处理信息的方式,设计了一种基于选择性注意的人脸识别方法。本文通过提取图像的全局特征来模拟视点产生之前人类视觉系统所获取的全局特征,然后利用人眼真实视点得到人脸图像上的显著性图,根据显著性图将人脸图像划分成注视区域和非注视区域,模仿人类视网膜成像来提取局部特征。最后通过融合两种特征来实现人脸识别。本文将上述实验框架在公开的人脸数据库和一般目标数据库上进行了测试,实验结果证明,将人类视觉系统的选择性注意引入到人脸识别中,不仅降低了编码量,而且提高了识别的性能,证明了将人类视觉系统的选择性注意引入到人脸识别中的合理性。4.视点变化在人类视觉信息获取和目标搜索上起着重要的作用,本文提出了一个基于神经元感受野不变性特征提取和眼动控制机制的人脸目标及其特征搜索系统。作为一个实例,系统应用到人眼中心搜索。这一系统的主要机制是:在学习阶段,在图像上均匀设置初始视点位置,令系统感知和学习需要搜索的人脸目标及其特征的空间方向、距离和尺度;通过高层认知神经元发出控制使视点由初始位置移动到人脸目标及其特征的位置上;在实际运行阶段,只要任意在图像上给出一个随机初始视点位置,系统就会根据学习和记忆经验指挥和控制视点自动地向目标移动,通过四至五步的视点移动最终使视点与目标特征(如眼中心)位置重合。依次类推,该系统可以顺次搜索到图像上一个目标的所有特征点,从而实现对目标的方向、距离和尺度的感知、搜索和定位。本文对视觉注意建模及其在图像分析中的应用进行了研究,并给出了有效的解决方法,证明了将人类视觉系统的选择性注意引入到图像分析中的合理性。