论文部分内容阅读
随着高清成像和并行运算硬件能力的提高,基于视觉海量数据的分析和理解技术已经成为模式识别与人工智能领域的研究热点之一。传统视觉识别算法一定程度上也考虑了生物感知计算的原理,例如利用训练海量的样本来动态调整神经网络模型的结构和参数,从而实现出所谓的最优决策。但是它们更多地只是利用了生物感知的一些基本特性,整体上仍是将其作为黑盒来进行模拟研究。事实上生物感知系统所具有丰富的视觉机制,是实现视觉理解和识别的基础。因此本文关注于生物感知系统中的视觉信息流处理机制,试图构建面向视觉识别的感知计算新模型,并以视觉识别中常见的面孔验证和识别为例展开应用研究。本文主要从视觉信息流在视通路上的多路径传递、倒立面孔与正立面孔的独立识别机制,以及基于局部和全局表征信息的多尺度面孔识别展开研究,具体研究内容及成果包括:(1)提出了一种基于视觉信息流双视通路的面孔验证模型。构建了底层卷积网络,模拟生物感知系统对视觉信息流的过滤;提出了双视觉通路概念,构建监督信号和识别信号融合的增强网络,实现对视觉识别特征的强化;最后,通过比较证件照片和多姿态面孔照片的特征分布情况,利用联合贝叶斯人脸的方法输出面孔身份的异同。实验结果表明,双视觉通路的设计能够提高面孔验证的准确率,说明了监督信号对面孔特征提取有约束作用。(2)提出了一种基于左右半球协作机制的正立和倒立面孔识别新方法。模拟视觉信息流在视通路中的传递和处理过程,首先构建底层神经网络,建立敏感纹理特征以及对称卷积核的机制,实现正立和倒立面孔图像的去除冗余和预处理;接着提出一种基于局部区域提取的池化神经网络层的概念,构建多局部特征融合的网络结构,实现局部信息的压缩提取和融合;最后根据高级视觉皮层中左右半脑协作的特点,提出一种融合整体和局部信息的预测函数。实验结果表明,本文方法能够实现正立和倒立面孔的识别,说明了整体和局部特征的两条视觉通路虽然分别在正立和倒立面孔识别上起了决定性的作用,但它们并不是孤立存在的,两条通路所刻画的面孔信息应该是一种互补式的关系。(3)提出了一种基于多层次信息表达的多尺度面孔识别新方法。模拟视网膜和神经节细胞对底层纹理特征的敏感特点,构建多层卷积级联的网络,以达到视觉信息过滤和提炼的目的;考虑到底层信息流对面孔特征表达的裨益作用,构建了基于局部和整体结合的多尺度池化的概念,输出固定大小的特征通道和特征图谱;根据视觉皮层的决策机制,各层次的特征信息融入到全连接层,利用神经元的激活特性判断面孔身份。实验结果表明,本方法可以有效应对多尺度面孔图像识别,从而说明底层纹理特征将有助面孔特征的表达。