论文部分内容阅读
视觉是我们获取外部信息的最主要方式。理解生物视觉系统的信息处理机制能够帮助我们更好地理解大脑的工作原理。视觉自适应性是视觉系统的最重要特性之一,视觉自适应性使得我们能够在复杂的动态环境下,保持对外部世界的可靠感知;其中的视觉颜色恒常性则让我们能够稳定地感知外部世界的真实颜色。本文以计算视觉理论为基础,通过模拟生物视觉系统的信息处理机制和外部刺激(如自然图像)的统计特性,以及场景中的光源、物体和视觉系统三者之间的交互作用,来发展有效的计算机视觉方法,为视觉颜色恒常和自适应性提供可行的理论计算框架和假设。本文第一部分工作研究单光源条件下的视觉颜色恒常性(第二章)。其中的第一个贡献是,我们通过模拟初级视觉皮层中的双拮抗神经元机制,发现双拮抗神经元对一幅色偏图像的响应有效地包含了场景光源颜色的信息。基于此发现,我们提出双拮抗神经元通过编码场景中的光源颜色来帮助视觉系统实现颜色恒常性。本文关于单光源下视觉颜色恒常性的第二个贡献是,通过对大量的自然图像进行统计分析发现,通过局部图像块估计的反射率之和与标准无色偏图像的反射率之和的比值具有统计不变性(statistical invariance)。基于此统计性约束和图像的物理成像模型,我们提出三通道估计误差不变性(Achromatic-Estimation-Invariance,(6(8?)的假设,并将其用于从一幅色偏图像中快速地估计出场景的光源颜色。本文第二部分(第三章)工作研究多光源条件下的视觉颜色恒常性。该工作的主要贡献是,提出了一个基于视觉机制的多光源颜色恒常性模型。我们假设自底向上(bottom-up)的视觉信息处理机制提供一个粗糙的,但快速的光源颜色图估计传导到高级视觉区域(比如V4),而自顶向下的机制(top-down),比如光源先验则进一步对经过自底向上处理所传导过来的视觉信号进行约束,获得更精确的光源颜色估计。本文的第三部分(第四章)工作研究不同相机(或视觉)颜色响应函数下的视觉颜色恒常性问题。我们发现,现有的基于学习的颜色恒常性模型的泛化能力非常有限,无法直接应用于多相机下的颜色恒常性。本文首次提出,在建立颜色恒常性模型的时候同时考虑相机的颜色响应函数和场景光源颜色的影响,我们的模型能够更准确地恢复出场景的真实颜色。本文的第四部分(第五章)工作研究视觉自适应性问题。我们通过模拟自然图像中的非线性统计规律(homogeneity和heterogeneity)建立模型,发现大脑中存在着一个由经典感受野和非经典感受野组成的动态神经元网络,它是大脑处理信息的最基本单元(texton),能够自适应地根据视觉输入的模式,比如,视觉信号在空间和时域上的统计结构变化,调整自身的状态,以应对自然场景中的复杂信息变化。我们发现神经元网络状态的变化,比如,模型的期望和由神经元网络结构决定的似然函数,能够很好地预测神经电生理实验中所观察到的各种神经元自适应现象。