论文部分内容阅读
基于内容的图像分类和检索是计算机视觉中的一个重要研究内容,当前的研究方法主要使用局部特征集合来描述图像,Bag of Features(BOF)的出现为基于内容的图像描述提供了新的解决方案。它将局部特征集合整体考虑,根据视觉码书量化局部特征并将其标记为视觉词汇,同时局部特征集被映射成一个关键词频率分布的直方图。BOF是图像处理与文本语义处理思想的有机结合,它的出现对图像的分类和检索效率的提高起了极大的促进作用。论文首先介绍了各种图像特征的描述方法,分析总结了图像语义理解的研究现状和发展趋势。论文深入研究了BOF的构建过程以及基于BOF的视觉分类和检索技术。在此基础上分析总结了影响BOF执行性能的各种因素,包括兴趣点检测器,码书尺寸,视觉词汇加权策略以及SVM分类核等。通过实验对影响因素进行了详细的评估,并给出改善性能的解决方法。针对BOF描述向量维数较高的特点,论文提出一种利用多分辨率BOF来加速匹配的有效查询策略。其主要思想是构建对应于BOF的低分辨率向量,通过在低分辨率下的比较,过滤部分较高分辨率的候选向量,从而在整体上提高BOF描述向量查询的效率。论文中采用了两种方法构建多分辨率BOF:均匀量化(Uniform Quantization)方法和非均匀量化(Non-uniform Quantization)方法。论文还提出了使用向量近似方法(VA-file)处理多分辨率BOF,实验结果证明了该方法有效的提高了查询效率,优化了在大规模图像数据集加载时的I/O性能。