论文部分内容阅读
图像分类是图像处理、计算机视觉、模式识别领域中极具挑战性的研究课题,利用计算机实现自动图像分类,关键是提取准确的图像特征、形成可区分的图像描述。基于词袋模型的图像分类方法是一种应用广泛的基于局部特征的图像描述和分类方法,其中局部特征的提取非常重要,其直接影响后续步骤中构建的视觉词典的准确性,进而影响生成的图像描述子的区分性。在局部特征提取阶段常用而且非常有效的一种方法是通过密集采点方法将图像规则地划分为固定大小的图像块,并以图像块的中心为关键点生成SIFT特征,但这种将图像块划分成固定大小的块并提取SIFT特征的方式不能自适应地获取适合尺度的结构特征,而这些适合尺度的结构特征可能对构建准确的视觉词典非常重要,因而不利于构建准确的视觉词典,从而也不利于生成准确的图像描述。本文结合视觉计算理论,就图像局部特征提取方法和图像描述子生成方法进行了研究。本文先采用初始素描模型得到图像的初始素描图,并据此对图像进行区域划分,将图像划分为包含结构信息较多的结构区域和包含结构信息较少的非结构区域,在结构区域提取混合尺度的图像块SIFT特征,在非结构区域提取单尺度图像块SIFT特征,以更好地表示图像局部信息,提高后续处理中视觉词典的准确性和描述子的可区分性,得到区分性较好的基于局部特征的图像特征。另外,图像的初始素描图是图像的一种稀疏表示,基于图像的素描线段的方向和长度的统计量能在一定程度上表示图像,本文直接对每幅图像的素描线段的方向和长度进行统计,得到基于素描线段方向和长度的统计特征,可以直接用于分类。将基于局部特征的图像特征及基于素描线段方向和长度的统计特征结合,可以形成更具区分性的图像特征,更好地表示图像,有利于分类。基于此,我们提出了基于视觉计算和词袋模型的图像分类算法和基于视觉计算和空间金字塔匹配的图像分类算法,并在公开数据集十五类自然场景Scene-15上进行了实验,结果表明本文方法能获得较好的分类结果。