基于全局和局部深度特征的图像重排序方法研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:zbl666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像检索重排序是图像检索的一个重要环节。在大多数图像检索系统中,用户提供查询文本,检索系统通过从附属于图片的元数据中提取文本信息与查询文本进行匹配,将匹配度高的图片返回给用户。这种方法只分析了文本信息,图片本身包含的视觉信息以及返回图片之间在视觉上的联系并没有被充分利用起来。因此,图像重排序通过提取图片的视觉信息并分析图片间的视觉关联,对图片序列进一步优化,极大地提高查询性能。图像重排序研究有两个重要因素:视觉特征提取和重排序模型构建。基于图模型的图片重排序算法具有良好的性能。此类算法将每张图片看作一个节点,节点之间的权重代表图片间的邻接关系,通常使用视觉相似度表达邻接关系。图片间的邻接关系迭代地在整个图网络中传播。传播达到稳定时,与周围图片共享较高视觉相似度(受欢迎)的图片将获得较高得分。由于大多数基于图的方法侧重通过分析图片间的视觉一致性来达到重排序的目的。这使得这类算法没有充分发挥那些与查询极可能相关(伪相关)的图片的作用。因此,本课题试图改善传统图模型重排序算法的这个问题,提出一种改进的VisualRank算法,使其能够充分发挥伪相关图片的作用,从而达到更好的排序结果。图像重排序的另一个重要的因素是图像特征的提取。深度卷积神经网络(Deep Convolutional Neural Network,DCNN)被广泛应用于计算机视觉的各个方面,如图像分类、图像检索。DCNN网络不同层的特征表达的图片信息的侧重点有所不同。浅层特征侧重表达图片的边缘、形状等细节信息但包含许多噪声;随着层数增加,图片的一部分细节信息被丢弃,特征表达的信息更加抽象。高层特征(如全连接层)对于图像分类而言,由于能够准确表达图像的语义信息,而物体类别也属于语义信息,因此非常合适。但对于图像检索问题,图片不仅需要具有相似的语义信息,也希望图片在视觉上具有一定相似性。高层DCNN特征损失掉了太多局部信息,无法较好地度量图片的视觉相似度。因此,将卷积层特征应用到图像检索中可以弥补仅使用全连阶层特征时导致的局部信息缺失的问题。因此,本课题希望将由多层卷积神经网络(DCNN)构造的特征应用于图像重排序,通过实验分析不同层特征的性能特点,设计更加完善的图像重排序算法。
其他文献
PCM/FM(脉冲编码调制/调频)信号是CPM(连续相位调制)信号中的一种类型,被普遍应用于军事卫星和航天遥测标准IRIG-106。本文主要的研究内容是频率调制系统和解调系统。   目
TD-LTE系统下行链路采用的多天线技术包括:发射分集、空分复用、波束赋形;在实际应用中,系统会根据不同的场景实现该三种模式的自适应切换。其中基于用户参考信号的波束赋形技术
人体动作识别是计算机视觉领域一大热门的研究方向。其主要目的是对视频中的人体动作进行正确地分类。这项技术可以被应用到智能视频监控、人机自然交互、运动视频分析以及无
相比于传统的无线通信,无线光通信具有无需频谱认证、超宽带宽、低功耗、数据速率高等已经存在的以及潜在的优点,并且在近几年引起了广泛的关注。而对于室外场景中的无线光通信
毛细管电泳是生化分析领域最具发展潜力的一种技术,激光诱导荧光检测方法由于其高灵敏度而得到广泛的运用。但是由于受到仪器本身的稳定性以及其它一些因素的影响,采集到的毛
随着通信技术的快速发展,电磁频谱资源紧缺与用户容量需求激增之间的矛盾日益突出,研究具有较高能量集中度的新型高效数字调制技术具有较为广泛的应用前景和迫切的应用需求。小