视觉颜色恒常和自适应性计算模型与应用研究

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:LXX_ACCP
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉是我们获取外部信息的最主要方式。理解生物视觉系统的信息处理机制能够帮助我们更好地理解大脑的工作原理。视觉自适应性是视觉系统的最重要特性之一,视觉自适应性使得我们能够在复杂的动态环境下,保持对外部世界的可靠感知;其中的视觉颜色恒常性则让我们能够稳定地感知外部世界的真实颜色。本文以计算视觉理论为基础,通过模拟生物视觉系统的信息处理机制和外部刺激(如自然图像)的统计特性,以及场景中的光源、物体和视觉系统三者之间的交互作用,来发展有效的计算机视觉方法,为视觉颜色恒常和自适应性提供可行的理论计算框架和假设。本文第一部分工作研究单光源条件下的视觉颜色恒常性(第二章)。其中的第一个贡献是,我们通过模拟初级视觉皮层中的双拮抗神经元机制,发现双拮抗神经元对一幅色偏图像的响应有效地包含了场景光源颜色的信息。基于此发现,我们提出双拮抗神经元通过编码场景中的光源颜色来帮助视觉系统实现颜色恒常性。本文关于单光源下视觉颜色恒常性的第二个贡献是,通过对大量的自然图像进行统计分析发现,通过局部图像块估计的反射率之和与标准无色偏图像的反射率之和的比值具有统计不变性(statistical invariance)。基于此统计性约束和图像的物理成像模型,我们提出三通道估计误差不变性(Achromatic-Estimation-Invariance,(6(8?)的假设,并将其用于从一幅色偏图像中快速地估计出场景的光源颜色。本文第二部分(第三章)工作研究多光源条件下的视觉颜色恒常性。该工作的主要贡献是,提出了一个基于视觉机制的多光源颜色恒常性模型。我们假设自底向上(bottom-up)的视觉信息处理机制提供一个粗糙的,但快速的光源颜色图估计传导到高级视觉区域(比如V4),而自顶向下的机制(top-down),比如光源先验则进一步对经过自底向上处理所传导过来的视觉信号进行约束,获得更精确的光源颜色估计。本文的第三部分(第四章)工作研究不同相机(或视觉)颜色响应函数下的视觉颜色恒常性问题。我们发现,现有的基于学习的颜色恒常性模型的泛化能力非常有限,无法直接应用于多相机下的颜色恒常性。本文首次提出,在建立颜色恒常性模型的时候同时考虑相机的颜色响应函数和场景光源颜色的影响,我们的模型能够更准确地恢复出场景的真实颜色。本文的第四部分(第五章)工作研究视觉自适应性问题。我们通过模拟自然图像中的非线性统计规律(homogeneity和heterogeneity)建立模型,发现大脑中存在着一个由经典感受野和非经典感受野组成的动态神经元网络,它是大脑处理信息的最基本单元(texton),能够自适应地根据视觉输入的模式,比如,视觉信号在空间和时域上的统计结构变化,调整自身的状态,以应对自然场景中的复杂信息变化。我们发现神经元网络状态的变化,比如,模型的期望和由神经元网络结构决定的似然函数,能够很好地预测神经电生理实验中所观察到的各种神经元自适应现象。
其他文献
已知动目标水声定位系统的定位误差由测距误差决定。在高精度水声定位系统中测距误差常为0.01m量级。这类系统对于由声速不均匀和声线弯曲引入的斜距误差常采用(全程)平均声
2018年我国出台了一系列政策,鼓励中小P2P网贷平台退出或者转型。2019年P2P平台将继续出清,众多中小P2P网贷平台面临着退出或转型。结合P2P网贷行业的现状,运用SWOT法从优势
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
自2016年11月谷歌神经网络翻译系统正式投入使用已经过去了一年多的时间。其翻译系统较之前的词组翻译系统有了显著的提升,在实用性上更为专业译员和用户所接受。该文选取高