论文部分内容阅读
随着计算机科技、物理和传感器技术、存储技术、网络技术的飞速发展,数据的膨胀日益加剧。手机随时拍以及各种场合不同用途的监控摄像头时时刻刻产生着海量图像(视频)数据,各类智能移动机器人的研究中也在不断收集和积累着实验和测试图像和视频。从信号处理的角度来说,图像是高维数据,携带了大量复杂的信息和特征,如何对图像数据进行高效的分析识别从而加以合理利用,是目前亟待研究和解决的问题。稀疏表示是近年来提出的一种新颖的信号处理技术,而压缩感知为其奠定了工程应用的理论基础。目前稀疏表示已经被广泛的应用于计算机视觉、机器学习等领域,并且取得了有益的成果。例如:图像压缩、图像去噪、图像超分辨率、图像重建、图像分类识别等等。本文对基于稀疏表示和深度学习的图像识别算法及应用进行了深入的研究,主要工作概括如下:1.图像稀疏表示和深度学习方法。概括并重新描述了图像稀疏表示的基本框架、方法;重点研究和重新描述了压缩感知的理论框架,包括信号的稀疏表示、观测矩阵设计、信号重构理论。同时对深度学习的基础函数进行描述和总结。2.提出了一种基于Log-Gabor的稀疏表示分类识别算法,通过将样本数据的全局特征和局部特征信息进行融合,达到提高识别率的效果。该算法在压缩感知和稀疏表示的框架下,利用相同类别样本之间在其特征子空间中的线性相关性,通过求解待识别样本在所有训练样本上的全局表示,利用全局特征进行构造词典,并结合样本的局部特征,对待识别样本进行稀疏分解和表达,使得到的稀疏表示向量尽可能具备特异性,能够应对每类训练样本数量较少的情况,减少类别对应数量,提高分类识别结果的准确性。在人脸识别和交通标志识别的实验表明,在随着训练样本数量和样本类别数量的增加,Log-GSRC算法比SRC算法在识别率上面有显著提高。3.提出了一种基于字典学习的稀疏表示分类识别算法,通过字典学习算法设计一个有效的稀疏表示超完备冗余字典,可以应对大多数样本数据量比较小的情况并在一定程度上解决外部环境变化导致的图像变异性大的问题,从而对待识别图像获得更稀疏和更精确的表示,然后使用稀疏表示分类器来进行图像识别。将该算法应用在人脸识别和交通标志识别上,实验结果表明,随着训练样本数不停地增加时识别率随着训练样本数量增加有显著的提高。4.提出了一种基于深度学习特征的稀疏表示分类识别算法,针对大样本数据提取样本特征并进行网络训练,设计了深度卷积网络模型,并运用稀疏表达方法,可在一定程度上有效地去除由于光照、遮挡、神态、姿势等一些不确定性因素造成获取图像质量不稳定的影响。该算法利用深度学习方法提取样本特征信息,通过样本训练得到优化的深度卷积网络模型,然后利用稀疏表示算法在测试集进行分类识别。实验表明该算法在小样本和复杂环境变化中识别率有着明显的提高。