论文部分内容阅读
随着大规模图像检索的应用需求日益凸显,近似邻检索算法因其低精度损失与高计算效率的优势,在大数据检索领域受到了越来越多的重视。在众多近似邻检索算法中,量化算法的检索精度优势突出且距离计算复杂度低,不仅在学术研究领域成为了热门,在实际应用场景中也被广泛使用。本论文主要研究了强化学习算法在图像量化检索领域当中的应用,采用强化学习当中的梯度策略算法来对量化检索中的码本优化问题进行求解。本论文的创新点与研究成果如下:一、提出要了一种新的基于共享码本的迭代量化检索算法。目前主流的量化检索算法多基于多码本重构特征向量,对于特征的量化需要多个相互独立的码本,这也导致了在编码和码本优化的过程中出现编码复杂度过大、优化时间长等问题。本文提出的共享码本迭代量化算法通过引入一个共享的衰减码本,有效地提高了量化算法的编码速度,同时也极大减小了检索所需要的码本存储空间。二、提出了一种基于强化学习的量化码本优化方式。由于传统多码本量化检索方法的编码优化问题属于NP-hard问题,其解决方式主要基于随机搜索的到近似解,该方式的问题在于随机搜素算法的计算复杂度过大且难以得到准确解。本文提出的共享码本的迭代量化检索算法,将编码优化问题转变成为一个基于欧式距离的码本序列选择问题,从而可以将编码优化过程融入强化学习算法解决。实验结果也表明,通过强化学习的优化,该量化检索算法的结果可以达到预期的结果。三、设计了一个融合图像特征提取与量化检索模块的端到端深度监督图像检索系统。传统的深度监督检索方法主要有两种:基于特征的欧式距离检索和基于哈希映射的汉明距离检索。相较于基于特征的欧氏距离直接检索,本文提出的检索系统有着近似邻算法的高计算效率优势,同时相较于哈希检索方式,本文利用量化算法的精度优势,大大提高了检索检索的性能。