基于深度特征的语义图像检索研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:xujinjinjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络上多媒体数据的爆炸性增长,如何在大规模图像数据中快速准确地找到用户想要的图像已经成为多媒体信息领域中重要的研究课题。基于内容的图像检索方法(Content-basedImageRetrieval,CBIR)因其对图像内容的描述能力,目前被广泛地采用。但基于内容的图像检索方法在计算机表达和人类理解之间存在语义鸿沟问题。
  近些年,有很多研究致力于缩小语义鸿沟,尽可能使计算机表达出来的图像内容与人类感知到的图像内容之间的差距变小。深度学习是机器学习中一种对图像特征进行学习的方法,利用深度学习技术得到的图像特征被称为深度特征。自卷积神经网络(ConvolutionalNeuralNetworks,CNN)在2012年被首先提出,以CNN为代表的深度学习技术凭借其强大的深度特征表达能力使得CBIR的语义鸿沟进一步缩小。但卷积神经网络因其自身框架的原因,存在表达图像特征能力有限,输出特征高维,需要大量带标签训练数据等问题。因此,本研究课题从以上三个方面入手,解决基于深度特征的语义图像检索目前存在的问题,提高大规模图像检索的精度和效率。本文的主要工作如下:
  (1)针对目前的卷积神经网络对图像特征的表达能力有限的问题,本研究课题首先从卷积神经网络的原理考虑,提出最大值-均值池化算法,结合Maxout非线性激活函数优化卷积神经网络的特征表达,在图像分类数据集上的对比实验验证算法有效性。
  (2)针对输出特征高维等问题,本研究课题从神经网络原理和网络框架两方面考虑,提出改进的自适应参数最大值-均值池化算法,在网络的全连接层添加新的隐层用于输出层特征降维及二值化,通过图像检索精度和效率的对比实验验证算法和框架的有效性。
  (3)针对卷积神经网络训练过程需要大量带标签数据的问题,本研究课题设计无监督对抗图像检索框架(UnsupervisedAdversarialImageRetrieval,UAIR),根据图像检索自身特点设计对抗训练方法,在无标签训练样本前提下优化深度特征表达,将生成对抗直接用于图像检索过程,通过一系列图像检索对比实验验证该框架的有效性。
  本研究课题致力于基于深度特征的语义图像检索的研究,通过一系列方法缩小大规模图像检索中的语义鸿沟。本文从算法原理,网络框架和训练方法三个方面去优化深度特征表达,使深度神经网络的输出特征更适用于CBIR。在将来的工作中,我们考虑将以上方法进一步扩展到跨模态信息检索中。
其他文献
无线通信的发展方兴未艾,由各类无线通信设备的增长和频谱分配不合理所带来的频谱资源稀缺现象正随着人类的发展而逐渐凸显出来[1]。电视白频谱(TV White Space,TVWS),由于其自身优良的传播特性,作为潜在的待开发频谱非常适合用于无线通信。动态频谱接入技术的提出,允许未授权的无线设备在不影响主要的授权设备使用的情况下,通过空闲的授权频谱资源进行通信[2]。这对于电视白频谱的应用是一个契机,
脑中风发病急,病死率高,是世界上最严重的致死性疾病之一。对于脑中风的治疗,预防和检测是整个过程的重要环节。微波检测由于具有非电离以及成本低等优点,成为具有广阔的发展前景的疾病可穿戴检测预警技术。其中天线作为微波信号的发射与接收设备,是微波检测系统重要的组成部分。因此,设计一款性能优越并适用于可穿戴微波检测系统的天线来提高疾病检测的准确性是具有重要意义的。折叠天线通过平面天线折叠来改变天线相位,在缩
学位
无人机(UAV)以其覆盖范围广、机动性强等优点,在提高无线通信系统性能方面有着巨大的潜力。本文主要围绕地面节点(GT)和UAV之间的能量权衡和UAV轨迹优化两个关键点,对UAV数据采集系统的优化传输策略进行研究。另对存在窃听者的场景下,对UAV中继系统保密能效最大化进行了探讨。具体研究内容归为如下三个方面:(1)首先,对单用户场景的UAV数据采集系统性能进行分析,引出了GT-UAV无线通信中的一种
学位
惯性导航系统是一种自主性强,有极强的抗干扰力,不受气象条件限制,满足全天候导航的导航系统。在航天、航空和航海等领域中有着广泛应用,是导弹等武器系统实现快速精确打击的重要保障。惯性导航系统结构复杂,误差源之间相互耦合,难以通过惯导系统误差参数,对其作战精度作出直观评估。同时由于战场情况瞬息万变,要求作战人员在短时间内作出武器系统精度评估和战术筹划,本文针对武器系统中的惯性导航精度进行准确快速地评估进
学位
盆栽试验结果表明,在高铁、高锰胁迫下硅对水稻生理特性、生长发育和产量有明显的正效应。高浓度铁、锰和低浓度硅组合,水稻根系活力、SOD酶活性和CAT酶活性最差、丙二醛(MDA)含量最高。相反,低浓度铁、锰和高浓度硅处理,上述水稻生理指标均有所改善。高硅,低铁、锰组合较对照分别增产15.2%和3.4%;高铁、锰组合不施硅肥较对照减产72.7%;低铁、锰组合不施硅肥较对照减产20.5%;高铁、高锰胁迫下
目前基于生成对抗网络算法的人脸图像相关应用,包括人脸合成,脸部去妆,表情合成等,是计算机视觉领域的研究热点。其中人脸表情合成算法一直受到研究者的广泛关注。表情合成即通过图像处理算法使得目标人脸图像拥有特定的表情细节。表情合成在日常娱乐、电影特效、公安刑侦面部合成和医疗影像等领域有广阔的应用前景,因而研究人脸表情合成具有重要意义。  本文在研究现有表情合成方法的基础上,提出两种不同类别的表情合成方法
学位
随着气候变暖,环境问题对于人类的影响越发严重,发展“低碳经济”成为大势所趋。物流行业作为二氧化碳排放大户,产生的二氧化碳占人类活动的5%,其中车辆运输配送过程产生的二氧化碳占总量的87%。所以研究配送中心选址、车辆运输配送路径的优化问题,不仅对节能减排具有重要意义,而且对于物流企业提升自身效益也具有重要价值。  本文以物流配送选址-路径问题(Location-RoutingProblem,LRP)
基于神经网络的对象检测算法(ObjectDetection)能够分析图片中的语义信息,预测目标的位置以及类别,相对于传统的对象检测方法有更好的表现。但在具体的应用场景中时常面临一些难点,包括:RGB图片颜色信息退化导致的对象检测精度下降问题;缺少有效数据造成样本数据规模较小,因而导致模型训练欠拟合的问题;基于神经网络方法的对象检测因为模型参数冗余、模型复杂,无法适应导航及工业场景等高实时性场景的问
学位
现实世界中不存在永远不发生故障的完美网络,复杂网络出现故障是一个普遍存在的现象。因此,针对网络中因为蓄意攻击,随机攻击等而发生大面积网络崩溃的现象,采用何种修复策略恢复网络的功能,提高网络的鲁棒性成了当前的一个研究热点。本文研究内容主要包括以下三个方面。  1、提出动态复杂网络的部分延迟开放修复策略。针对发生级联故障的复杂网络,首先从故障节点中选择一定比例的节点作为延迟开放节点,然后选定延迟周期(
糖尿病性视网膜病变(DiabeticRetinopathy,DR)是糖尿病严重的并发症,是视力损害最常见的原因之一。糖尿病病情的不断发展,会对患者造成不同程度的视力减退。临床上,眼科医生通过观察眼底图像中潜在的病变区域(例如眼底出血、微动脉瘤、渗出物等),对DR进行详细的筛查和诊断,并针对患者病情给出相应的治疗措施。由于人工筛查存在主观性大、耗时长等问题,很多患者因此可能错过最佳治疗时间。因此,通