论文部分内容阅读
稀疏性分析源于视觉感知的神经生物学研究。已有的研究揭示了在人类低层和中层的视觉系统中,神经元对于外部信号的表达和处理过程具有高度的稀疏性,包括空间维稀疏性和时间维稀疏性。近年来,受到神经生物学研究结果的鼓舞和启发,稀疏性分析在模式识别领域也受到越来越多的关注。基于稀疏性分析的特征选择与特征学习已经在分类技术的研究中得到广泛的应用。然而针对稀疏性分析的研究还不完善,有许多现象和问题还没有得到很好的解释。
本文针对模式的稀疏性分析及其在识别中的应用这一课题进行研究,其中有两个研究重点,第一个研究重点是模式的稀疏性分析,该重点又分为模式表达的稀疏分解和稀疏分解的词典学习两个核心问题。第二个研究重点是稀疏性分析在识别中的应用,本文以字符识别和人脸识别为具体应用研究对象,以稀疏表示的重建误差作为匹配分类依据,将模式的稀疏性分析与识别应用中的具体问题结合起来。结合研究重点并与核心问题相对应,本文研究工作包括以下三个部分:
①结合研究思路和项目需求,针对大类别集识别或大规模训练样本的问题,直接采用稀疏表示方法会带来计算上的困难和结果的不稳定性。针对这种情况,本文提出了一种局部稀疏表示方法,并结合多模板匹配方法,提出了一种两级分类策略,应用于退化汉字和手写数字识别中。实验结果表明,本文提出的局部稀疏表示算法,不仅能提高识别准确率,还可以有效地节约运算时间。
②在前面工作的基础上,发现训练样本集不仅单个样本受到较大噪声的干扰,而且同类模式样本之间也存在较大差异呈现多子类分布,破坏了稀疏表示中同类样本之间强线性相关的前提假设。鉴于此,本文提出了一种基于聚类的鲁棒主成分分析方法,在聚类后的每一类样本的基础上结合低秩矩阵恢复方法进行稀疏表示。在手写数字和人脸识别上的实验结果表明,该方法可以有效地抑制大噪声和大扰动对稀疏表示的影响,且随着噪声比例的增加,该方法相对于传统的稀疏表示方法识别效果提高越明显。
③在基于稀疏表示的识别方法中,词典学习也是一个基本问题,直接影响到识别的计算复杂度和分类准确率。本文详细分析了稀疏表示词典的判别性信息的来源,提出了一种有监督的判别性低秩词典学习算法。该方法有两个特点:其一,学习的目标是使得学习到的词典具有判别性,体现了不同类别词典之间的区分性;其二,引入对词典矩阵的低秩性约束,体现了类内词典的相关性。在USPS手写数字数据库,耶鲁大学的ExtendedYaleB人脸数据库,AR人脸数据库和ORL人脸数据库上的实验结果表明,本文提出的词典学习算法均能够有效地提高稀疏表示方法的分类性能。