论文部分内容阅读
图像特征反映了一副图像的本质信息。按照是否以图像整体为研究对象,广义上可以将图像特征划分为图像全局特征与图像局部特征两大类。图像局部特征有抗遮挡能力强、抗畸变性良好等优点,但其图像描述能力较弱,噪声、模糊鲁棒性较差。图像全局特征具有描述能力较强,噪声、模糊鲁棒性高的优点,但存在抗遮挡能力差、在场景复杂时识别能力弱等缺点。正交矩作为一种图像全局特征,继承了图像全局特征的优良特性,同时具有计算简单、抽样性好、图像描述能力强等优点。但如何提高其抗遮挡能力和解决复杂场景下的识别问题,一直以来是正交矩研究领域的热点。本文设计了一种基于正交矩的图像局部特征提取方法,主要包含两个部分:构建局部特征检测算子和构建局部特征描述算子。其中,特征检测算子主要是用来定位图像兴趣点(又称为关键点或特征点)的位置,特征描述算子是一组用来唯一性表征图像兴趣点所在区域的特征向量。该算法的特征检测算子构建过程如下:首先以图像正交矩为基底构建类Hessian矩阵,将Hessian矩阵的行列式与迹平方的差值定义为图像角点;其次结合图像尺度空间理论,利用多重层次模板构建多重正交矩,并利用生成的正交矩模拟构建图像金字塔以实现特征尺度不变性;再次利用非极大值抑制获取图像金字塔中每个像素点的上层3?3邻域、同层3?3邻域、下层3?3邻域中具有最大角点响应的点,并将其作为候选特征兴趣点;然后利用二维二次插值精确定位兴趣点位置,取候选兴趣点本身坐标及其上下两层邻域的中心坐标构建二次函数,将二次函数导数的零点位置作为最终兴趣点位置;最后为了消除图像边缘响应对角点响应的干扰因素,计算Hessian矩阵迹的平方与行列式的比值,将该比值与给定阈值比较后去除边缘响应点。该算法的特征描述算子构建过程如下:首先将兴趣点的8?8窗口划分为4个4?4子块;然后计算子块内梯度方向直方图,确定像素子块内8个方向,并将梯度方向直方图的得分最高项做为主方向。最后由兴趣点4个子块内的8个方向构建128维特征向量。实验结果表明,对于旋转缩放场景,本文提出算法重复率波动较小,精准率与召回率评价结果与其他算法相当;对于视角变化场景,本文提出算法整体重复率较高,对于纹理图像整体表现呈现出超越其他算法的趋势;对于图像模糊场景,本文提出算法均取得了较高重复率且曲线波动平稳,精准率与召回率总体优于其他算法;对于光照变化场景,本文提出算法取得了最高重复率与最高召回率,整体上优于其他算法;对于图像压缩场景,本文提出算法取得了所有评价指标的最高分数;对于图像噪声场景,本文提出算法取得了最高重复率。综合实验结果表明该算法可以有效对抗图像几何畸变,且在图像发生质量变化时有着更好的鲁棒性。