论文部分内容阅读
随着互联网技术的快速发展以及数字多媒体的广泛应用,大量图像数据应运而生。海量的图像数据以及图像的复杂性给图像检索带来了巨大的挑战,如何快速准确地检索出人们需要的图像成为亟待解决的问题,图像检索更是成为了人们关注的焦点。但是传统的一些图像检索算法无法满足人们日益增长的需求。近几年,基于哈希的图像检索技术成为热点的研究分支,哈希算法将高维图像数据映射到低维汉明空间,使用二进制编码表示图像。哈希算法既可以降低存储空间,也可以提高检索速度,因此研究基于哈希的图像检索技术具有重要意义。本文在深入学习分类器知识、非参数贝叶斯理论以及类标传递方法的基础上,针对现有哈希算法存在的不足,对哈希算法进行改进。本文的主要工作如下:首先,对哈希算法进行深入分析,根据哈希映射后数据二值编码的特点,提出一种基于分类器的监督哈希算法,将每一位编码问题转化为分类问题,使用经典分类器对图像进行编码,从而提高了图像检索的准确率;其次,针对现有哈希算法对数据分布的描述不够准确的问题,提出一种基于非参数贝叶斯的监督哈希算法,使用狄利克雷过程对数据分布进行建模,并建立数据和编码之间的图模型,从而实现对数据进行精确编码;最后,针对无监督哈希算法精度低而监督哈希算法需要大量类标的问题,提出一种基于类标传递的半监督哈希框架,并将现有的监督哈希算法以及本文提出的基于分类器和非参数贝叶斯的监督哈希算法应用到此半监督哈希框架下。实验结果表明,本文提出的基于分类器和非参数贝叶斯的监督哈希算法的图像检索精度远远高于传统的哈希算法,本文提出的基于类标传递的半监督哈希算法在少量标记数据的情况下,同样可以得到非常高的检索精度。