论文部分内容阅读
随着互联网技术的发展,图像的数量大规模增长,对计算机视觉的发展起到促进的作用。同时,如何从大规模数据中找到所需要的图片是一个急切需要解决的问题。在大规模图像检索时,由于最近邻搜索详尽地对比查询样本与每个训练样本,则使得线性查询时间代价高昂。为了解决此问题,基于哈希的图像检索的方法被提出。然而,传统的哈希方法采用浅层特征去生成哈希码,但浅层特征不能很好地代表图像信息。近年来,由于深度学习可以更好地获取图像的信息,提高图像检索的效率,因而它更适合于大规模图像的检索。本文围绕基于深度学习的哈希图像检索展开了深入研究,本文的主要工作及创新点如下:(1)概述了深度学习的相关知识和几种典型的深度学习模型的基本原理和思想;并介绍图像哈希技术的基本知识和几种典型图像哈希技术的基本原理和思想;然后对主流的深度学习哈希方法基本原理进行阐述。(2)现有的深度哈希学习方法采用浅层的映射将深度特征映射成哈希码,因此不能很好地利用深度特征。本文提出了一种监督的端到端的深层网络结构来同时进行特征和哈希码的学习,命名为深度学习监督哈希算法(Deep Learning Supervised Hashing,DLSH),该方法通过将卷积神经网络(Convolutional Neural Networks,CNN)和循环神经网络(Recurrent neural Network,RNN)组合在一个统一的结构中能同时进行哈希码和特征的学习。DLSH利用CNN和RNN的优点捕获输入的非线性结构以生成紧凑的、可识别的哈希码。DLSH的特征学习和哈希码学习之间不仅可以相互反馈,也能够将深度特征采用深层的映射去生成哈希码。同时,DLSH设计了一种新的目标函数来维持哈希码的平衡性和语义相似性,确保每一个比特变成0和1的概率一样。该方法在MNIST、CIFAR-10、CIFAR-20和YouTube Faces图像数据库上比一些当今的哈希方法有更好的表现。(3)针对现有深度哈希方法只使用语义特征去生成哈希码但忽略纹理细节的这一缺点。在本文中,提出了一种新的分层递归神经哈希算法(Hierarchical Recurrent Neural Hashing,HRNH)。该方法利用同时包含了图像的纹理细节和语义信息的分层卷积特征去生成哈希码。同时,该方法可以直接利用卷积特征图作为输入来维持卷积特征图的空间结构,可以获得更有效的信息以生成哈希码。并且该方法设计了一种新的损失函数来控制连续编码到离散的二进制码的量化误差,同时保持了哈希码的相似性和平衡性。该方法在MNIST、CIFAR-10、CIFAR-20和YouTube Faces图像数据库上比一些当今的哈希方法有更好的表现。