论文部分内容阅读
本文所研究的自然图像的稀疏编码(sparse coding,SC)算法(即神经稀疏表示法)是一种模拟哺乳动物视觉系统主视皮层V1区简单细胞感受野的人工神经网络方法,这种方法可以成功模拟V1区简单细胞神经元感受野的三个特性:空间的局部性、方向性和频域的带通性(在不同的空间尺度上具有选择性)。而且,这种方法编码方式的实现仅依靠外界感知信息的统计特性,并不依赖于输入数据的性质,因而是一种自适应的信号统计方法。 目前,稀疏编码技术已被广泛应用于语音信号分离、视觉图像处理、生物DNA微阵列数据分类和模式识别等诸多领域。但是,由于神经生理学家目前对主视皮层V1区的了解仍然知之甚少,所以稀疏编码技术尚处于发展阶段,其在理论和应用方面的研究还有待于进一步深化和完善。 本文首先回顾了初级视觉系统的生物背景知识以及SC问题的发展历史、研究现状和存在问题,并对SC问题进行了简单的数学描述。然后针对一些SC算法和应用问题进行了深入的研究,提出了一些有效的SC方法,并对现有的一些方法做出了相应的改进和完善。全文的主要研究工作可以概括如下: 1、提出了一种扩展的建模主视皮层V1区简单细胞感受野的SC算法。经典的SC算法收敛速度很慢,而且不能同时完全保证系数分量的稀疏性和独立性,其目标函数中也没有保证最大化稀疏性和最小图像重构误差平衡的约束项。针对这些问题,我们使用峭度的绝对值作为系数分量的稀疏性度量标准,可以同时保证系数分量的稀疏性和独立性;同时在目标函数中引入固定系数分量方差项,保证了图像最小重构误差和稀疏性惩罚函数之间的平衡。另外,为了快速地找到最优基向量,我们使用Gabor小波基初始化SC的特征基函数,使得该基函数具有一定的类似V1简单细胞感受野的初始结构,进一步提高了SC网络的收敛速度; 2、基于我们提出的SC模型,为自然图像的特征提取和压缩提供了一种基于视觉信息处理的新途径。传统的图像特征提取方法是建立在数字信息处理和概率统计的基础上,与人眼视觉系统强大而复杂的信息处理能力仍相差甚远,因此,基于视觉特征的自然图像特征提取方法要优于传统的特征提取方法。本文提出的