论文部分内容阅读
形状匹配与识别是计算机视觉中的重要分支问题,它在目标识别、图像检索、图像配准、目标追踪等领域都有重要的应用。近年来,专家学者们在形状匹配与识别方面做出了卓然有效的研究成果,但这个领域仍然有很多问题没有解决,如:目标的线性变换、目标的局部形变与遮挡、目标的非刚性变换等等问题带来的形状差异。为了解决这些问题,必须对形状描述符与描述子匹配算法进行研究改进。本文在深入研究总结传统形状匹配识别算法的基础上,提出了一些新的解决方案。本文主要研究内容如下:1、总结了形状匹配与识别的一般流程,并按照形状匹配与识别的一般流程的步骤对形状匹配与识别的相关算法进行了介绍和分析。形状匹配与识别算法的一般流程包括:形状提取、形状表示、形状匹配与识别。本文分别对这些步骤算法的国内外研究现状进行了分析,并对其中典型的方法进行了介绍。2、针对仿射变换下形状匹配中存在的描述子对形状的描述能力不足,以及描述子计算耗时大的问题,改进基于所有图像点投影的方法,提出一种利用轮廓计算投影面积的仿射形状匹配算法。该算法分为粗匹配和精匹配两个阶段。粗匹配阶段,首先统计轮廓投影面积作为特征点描述子;然后利用动态规划蚁群算法匹配两幅图片公共特征点序列,并将该特征点序列记为对应的新特征点;最后采用该新特征点划分目标曲线。精匹配阶段,采用小波仿射不变描述子,对粗匹配阶段匹配代价最小的5%的目标进行对应曲线匹配,从而达到对仿射目标的识别。该算法的平均检索速度比传统基于形状投影分布描述子提高44.3%,在MPEG-7图像库上的检索正确率为98.65%,在MPEG-7仿射图像库上的综合评价指标比传统基于形状投影分布描述子高3.1%,比形状上下文高25%。该算法能应用于仿射形状匹配与识别领域。3、非刚性变换与局部形变下的目标形状识别是形状识别的一个难点问题。针对目前的形状识别算法在形状目标发生非刚性变化时识别率差的问题,提出一种基于曲率词袋模型的形状识别算法。首先使用离散轮廓演化算法得到目标物体轮廓的近似多边形,并用多边形顶点将形状轮廓分解为轮廓片段;然后使用轮廓词袋模型表示形状轮廓片段;最后采用线性支持向量机对形状特征描述子进行分类识别。其中轮廓词袋模型表示形状轮廓片段的步骤为:1)对轮廓片段等曲率积分采样并计算曲率特征,得到曲线的曲率特征表示;2)对每个轮廓片段使用基于局部约束的线性编码算法进行编码;3)使用max_pooling方式对不同曲率积分等级的轮廓片段池化得到形状特征描述。该算法在MPEG-7数据库中的识别率最高能达到98.21%;在Swedish Leaf与Tools数据库识别率最高分别为97.23%和97.14%,比采用基本特征描述子的识别率提升了近10%。该算法能应用于非刚性变换与局部形变下的目标形状识别领域。