论文部分内容阅读
图像是人眼认识世界的基础,是自然景象和事物的客观反映,也是记录事物形态的作品,本身就包含着大量的几何信息。而图像分割作为获取真实世界信息的重要途径,也是计算机视觉、模式识别、图像理解等领域的重中之重。普通的图像分割方法通过利用图像较低级的特征,例如颜色、灰度、形状、纹理等,将图像划分成若干区域,在同一区域的内容具有相似特征。能否完整准确地将分割图像中具有独特性质或是人类感兴趣的形状区域提取出来用于不同的研究,则是衡量图像分割效果好坏的一项重要指标。由于现实世界复杂的环境与成像技术的优劣,分割效果往往受到各类噪声、分割形状受到物体遮挡、目标与背景特征相似等影响。当前,深度学习作为一种复杂的机器学习算法,由于其具有多层级的神经元网络能够组合图像较低级特征从而形成更加抽象的人眼无法观测到的高级属性类别或特征,所以能够使用深度学习模型提取图像中的目标形状信息以及更多复杂高级信息。本文基于深度学习模型以及图像分割理论提出一种基于深度学习模型建模形状的方法。对于图像分割中如何运用形状信息,提出结合传统经典图像分割框架的深度学习图像分割模型结合图像底层以及高层信息辅助图像分割,提高分割效果,以得到完整准确的图像目标形状。并且将形状建模分割结果用于遥感图像目标的显著性检测中,能够得到较好的检测结果。结果研究内容大致概括如下:(1)对于表征形状问题,提出一种卷积深度置信网络形状模型用于形状建模。卷积深度置信网络由卷积受限玻尔兹曼机发展而来,能够在其基础上提取更加复杂的信息并且具有各个组成模型的优点。由于卷积深度置信网络为一种深度学习模型中的概率生成模型,能够针对联合分布进行建模及表征形状,文中给出模型结构、数学表示、构造机制、训练以及生成形状方法。通过CUB200 2011和Weizmann Horse数据集实验,结果表明该模型对比于其他同类深度学习模型建模形状的较好能力及有效性,并且通过欧氏距离这一评价指标衡量生成形状与原始形状间差异。(2)在运用图像纹理、颜色等底层特征的传统概率图模型——条件随机场图像分割框架中,通过卷积深度学习形状模型引入全局以及局部形状特征,从而提出条件卷积深度学习图像分割模型,该模型条件随机场图像分割模型的基础上结合高层以及细致的局部特征对目标进行分割。该模型的优势在于能够获取输入图像的二维空间结构特征和细致的图像局部特征,并且模型中含有池化层使其能够接受微小的平移变换,由于权值共享还能够减少复杂计算。实验结果表明,因为提出的模型利用卷积深度学习模型使得在图像分割中输入灵活,获取更高阶的形状特征信息,所以对含噪声、受遮挡等现实世界复杂的图像在进行分割过程中,取得较好的效果。