论文部分内容阅读
随着Internet与多媒体技术的发展,基于内容的图像检索技术成为了热门的研究领域。本文在介绍基于内容图像检索的底层特征提取、降维方法、相似性度量等的基础上,针对图像检索中的语义鸿沟与维数灾难问题,深入研究了机器学习与图像哈希技术。首先,提出了一种半监督的双线性映射方法,该方法同时利用有标识和无标识的样本,在低层特征与标签之间建立双线性映射机制,通过构造回归函数,利用回归残差最小及保持流形平滑对函数进行优化,不仅可以降低维数,还可以减小语义鸿沟。在CorelPhoto Gallery图像库中跟流形嵌入FME方法进行了对比分析,证明了提出方法的有效性。其次,针对主流非监督哈希方法中使用阈值法进行线性映射时存在的问题,即相似的点被赋予不同的标签而距离很远的点又有相似的哈希码,提出了一种基于位校正的非监督哈希方法。该方法主要是对局部敏感哈希算法与谱哈希算法的改进。算法中通过引入伪标签与点对关系,不断迭代并自适应地调整数据协方差矩阵,使靠近阈值的点对尽可能拥有相似的哈希码,同时在优化目标函数时,通过设计正则项来避免过拟合,从而提高检索效率。实验采用CIFAR-10和Tiny Images Dataset两个数据库,对改进的算法与主流非监督算法进行了实验比较,分析了哈希位数对检索效果的影响,比较了不同哈希方法汉明排序结果的查准率与查全率,并计算了各种方法返回的前36幅图像的准确率。实验证明,所提方法在检索效果方面优于大多数主流的非监督哈希方法。最后,在总结本文的基础上,分析了所提方法的不足,明确了进一步的研究方向。