论文部分内容阅读
图像具有自然的二维空间结构,空间上邻近的点通常具有相近的像素值,意味着图像具有局部光滑性。传统分类学习方法常将原始图像拉成向量,造成空间结构的破坏,由此直接基于图像的2D特征抽取法应运而生。典型的,如2DLDA、2DPCA,相比向量方法,计算复杂度显著降低,但其操作针对的是图像整行(或整列),导致空间光滑度过粗。为此,空间正则化(spatial regularization)通过在向量化空间中显式地施加局部空间光滑弥补这一不足,由此获得了比2D抽取法更优的分类性能,但其遗传了向量法的高计算代价。最近,隐性空间正则化方法(implicit spatial regularization,ISR)提出利用图像划分与重组隐性地体现图像局部的空间光滑,而后再利用现有2D方法抽取特征,使典型双边2DLDA性能优于SSSL(一种典型的显性空间正则化方法),但是,仅隐性地光滑缺乏显式的强制约束力,其特征空间依然欠光滑,同时双边2DLDA由非凸问题获得,计算复杂且不能求得解析解。因此,尽管不同的图像空间结构信息利用策略这些年零零散散的被提出与发展,但这些方法在空间信息利用程度和计算代价上难以两全。本文立足图像空间结构信息在图像分类中的充分利用展开研究,结合特征抽取和面向图像有序回归提出两种空间结构信息利用方法,具体成果如下:1.为克服上述现有空间结构信息利用策略的不足,提出一种结合显性与隐性空间光滑的高效二维图像判别特征抽取框架(2D-CISSE)。2D-CISSE兼顾考虑空间结构信息的充分利用和计算代价的降低,其关键步骤是预先进行显性地全局光滑,紧接着进行ISR,不仅继承了ISR的隐性光滑,而且可直接获得全局最优投影,同时该框架具有一般性,即现有大部分的图像光滑方法与2D特征抽取法均可直接嵌入。最后,在人脸数据集Yale、ORL、CMU PIE与AR,手写数字数据集UMIST与USPS上实验显示该框架获得了比ISR+双边2DLDA以及SSSL等更优的分类性能和效率。2.现有的有序回归方法缺乏对图像空间结构信息的有效利用,受支持矩阵机SMM启发,改进显式约束的支持向量有序回归算法,保持图像2D结构,对投影矩阵低秩约束,提出显式约束的支持矩阵有序回归EXC-SMOR。EXC-SMOR能有效聚合强相关的行与列,空间结构信息得以充分保持与利用。通过有序人脸数据集JAFFE与UMIST上的实验显示了EXC-SMOR具有比SVOR更优越的分类性能。