论文部分内容阅读
图像分类方法是计算机视觉和图像处理领域的重要技术。随着信息技术的快速发展,图像数据呈爆炸式增长。面对海量的图像数据,在分类器学习中如何快速高效地挑选少量高质量的图像数据已成为图像分类方法的一个研究热点。本文针对图像分类方法中用于训练分类器的训练样本的选择技术进行研究,并有针对性地提出多个算法和技术方案。本文的主要研究工作如下:(1)讨论了基于主动学习算法的图像分类方法的采样策略。研究分析现有图像主动分类方法应用较广泛的不确定性采样策略,为本文基于重采样思想的图像主动分类方法提供理论基础。(2)针对传统图像主动分类方法中仅利用未标注样本当前价值的问题,综合考虑了样本的当前价值和期望价值,提出最大分类优化算法。保证挑选出的样本具有较高的价值,优化分类器的分类性能。(3)目前传统图像主动分类方法通常是直接从未标注样本集中挑选样本,忽略了噪声样本点的影响。针对此问题,本文提出基于局部密度信息的无向图模型构建方法,在构建的无向图模型上处理噪声图像数据,减少噪声样本对采样策略性能的影响。(4)针对传统代表性样本采样策略选择的样本代表性较差的问题,提出一种基于无向图模型的代表性样本提取的新方法。采用构建的无向图模型计算样本的代表性,并结合最大分类优化算法,挑选出信息含量大的具有代表性样本并对其进行标注,以更新分类器。本文对提出的方法进行了实验验证,结果表明本文提出的技术方案是行之有效的。