论文部分内容阅读
随着数字图像数据的快速增长,让计算机自动理解图像成为越来越迫切的需求,作为图像理解的重要研究内容,图像分类识别(主要包括场景分类与目标识别)得到了广泛关注,是当前计算机视觉领域的研究热点。图像分类识别在计算机视觉的许多领域有着广泛应用,如基于内容的图像检索、遥感图像分析、智能视频监控和机器人定位导航等。经过几十年的发展,尽管图像分类识别研究已取得许多令人鼓舞的成果,但由于问题本身的复杂性,其仍然是一个极具挑战性的问题。本文针对图像分类识别,重点研究了局部特征描述及其在图像分类识别中的应用、基于低层特征建模的场景分类方法、基于局部特征建模的图像分类识别方法(包括场景分类、目标识别、纹理识别和行为识别等)、显著性目标检测等。本文开展的工作和取得的成果主要有以下几方面:(1) GBPWHGO与GLID两种图像局部特征描述方法。本文针对场景分类和目标识别的特点,分别提出GBPWHGO和GLID两种图像局部特征描述子。GBPWHGO描述子主要针对场景分类,根据场景分类的特点,其主要强调在场景分类过程中特征描述向量的判别性,以及对场景的全局表示。实验结果表明,GBPWHGO描述子在场景分类中的性能优于SIFT、LBP和Gist等描述子。GLID描述子主要针对目标识别过程中的尺度变化、视角变化、旋转变化等影响,在一定程度上弥补这些变化对于目标识别的影响。因此,GLID描述子强调对图像局部特征的不变描述,其对尺度、旋转变化具有较强的不变性,并对仿射变化具有一定的鲁棒性。实验结果表明,GLID描述子在场景分类和目标识别中的性能优于SIFT和LBP等描述子。(2)基于低层特征建模的自然场景分类方法。当前,针对场景分类问题,主要有基于低层特征建模和基于语义特征建模两类方法。前一类方法算法简单、计算量小,但一般适应于较少类别场景的分类,且分类性能较差。后一类方法适用于大量场景类别间的分类,且分类性能较好,但计算量大、所需的存储空间和内存消耗大。针对上述情况,本文提出一种新的场景分类方法,该方法属于基于低层特征建模方法的范畴,有着基于低层特征建模方法的优点,然而解决了基于低层特征建模方法的缺点、同时具备基于低层特征建模和基于语义特征建模两类方法的优点:算法简单、计算量小、所需的存储空间和内存消耗小、适应于大量场景类别之间的分类且分类性能好。通过结合GBPWHGO描述子,本文提出的基于低层特征建模的自然场景分类方法,在多个场景分类数据库上获得当前最好的分类结果。(3)基于局部特征建模的图像分类识别方法。当前,基于局部特征建模的图像分类识别,最常用的方法是“特征袋”方法和“空间金字塔匹配”方法。“特征袋”方法将图像表示成局部特征的无序集合,忽略了图像各部分间的空间位置关系。“空间金字塔匹配”方法通过将图像由粗到细划分为多个子区域,求取各子区域的特征直方图,在一定程度上利用了图像的空间信息。本文针对“空间金字塔匹配”方法,在图像局部特征提取及空间信息表达方面作了一些有效改进:本文采用多分辨率多尺度的局部特征提取方式,提取的局部特征具有更强的判别性,且对尺度变化具有更强的鲁棒性;在空间信息表达方面,不同于以往常用的均匀网格图像划分方式,本文采用水平、垂直的图像划分方式。实验结果表明,改进后的方法图像分类识别性能有了较大提升。(4)显著性目标检测。本文采用图像的颜色信息,提出一种基于全局颜色对比度的显著性目标检测方法。该方法能够计算输入图像的显著性图(Saliency map),并自动检测图像中的显著性目标,其对图像分类识别、目标检测、对感兴趣目标的分割等计算机视觉方面的应用具有重要意义。