图文交叉检索方法研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:cnwan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0时代的发展,图像、文本、声音、视频同时存在的跨媒体数据正渗透到人类社会生活的方方面面。跨媒体数据尤其是图像和文本数据的广泛共同存在,无论是短期来说为解决跨媒体检索问题还是长期来讲实现计算机用人类语言与人类交流的目标来说都提供了数据基础。本文立足跨媒体大数据时代信息检索的新需求,围绕图文数据呈现的多模态、复杂异构、海量、大时空尺度和社会性等特点,研究探索图文交叉检索任务的解决方法。本文针对数据集中存在大量与检索不相关的文档的现状,基于局部敏感哈希算法和神经网络学习提出了数据集约减算法对检索数据集进行了约减。本文基于传统方法和深度学习理论各提出了一个图文交叉检索模型:首先,基于处于异构空间中的图文数据特征映射到同构空间中的思路,利用多标签信息对传统的典型相关分析方法做出了优化,提出了融合语义的核典型相关分析方法;其次,基于卷积模型提取的图像特征图可以作为图像语义片段特征的观点提出了一个细粒度的图文匹配卷积融合网络,通过融合编码图像和文本的语义片段特征得到图像文本的匹配分数。本文主要工作及研究成果包括以下三个方面:(1)本文针对图文交叉检索任务中,数据集中往往包含大量与查询需求完全不相关的内容的情况,基于局部敏感哈希算法和神经网络提出了一种可以显著提高数据集中相关文件比例的数据集约减算法。(2)本文针对传统典型相关分析方法在对图文交叉检索问题建模学习共享子空间时,不能很好的对图像文本之间非线性的相关关系很好的建模,以及对图文交叉检索任务的一些辅助信息不能加以利用的不足的问题,将多标签形式的语义信息用于优化核典型相关分析方法,建立了融合语义的核典型相关分析模型。(3)针对目前多数基于深度学习的图文交叉检索方法中,文本与图像的建模过程完全独立,没有任何交互,直到生成了最终的向量表示才进行关联分析建模的现状,设计了提取图像和文本细粒度特征并对图像文本的细粒度特征融合编码的卷积融合网络,该网络既允许在一定程度上分别抽取图像和文本各自的特征又允许图像和文本的特征充分融合编码并最终产生图像和文本的融合特征用于得出图像文本对的匹配分数。
其他文献
城市发展势不可挡,它所代表的现代文明正在中国的大地上生根发芽。在中国社会从农耕文明转向城市文明的当下,小学生的城市启蒙教育意义重大而深远。小学阶段是儿童形成正确的
一维钒氧化物,因其独特的纳米尺度特征,在声、光、电等方面表现出一系列优异的性能,尤其是应用于电化学储能材料时,一维钒氧化物所具有的大表面积、短离子传输路径、高理论容量、低成本等特点使其在锂离子电池电极材料应用方面表现出十分广阔的应用前景。本文选取水热合成的方式,制备了一维纳米结构的钒氧化物,并对其进行X射线衍射(XRD)、扫描电子显微镜(SEM)、X射线光电子能谱(XPS)分析,对一维钒氧化物的物
公共服务的供给能力体现着国家的综合治理能力和治理水平,因而向社会提供优质高效的公共服务是公共部门必然的价值追求。同时,在信息时代的引领下,公共服务内容和体系正在发
结构拓扑优化(Topology Optimization)是根据设计域内的负载情况、约束条件和性能指标来优化材料分布,寻求结构的最佳传力路径。由于其可以在满足结构性能的前提下,有效降低材料用量,并且其新颖的拓扑构形可以为工程创新设计提供方案,因此受到了众多学者和工程设计人员的青睐。另外,随着科学技术和优化理论在实际工程结构设计中的不断发展,单一材料的结构拓扑优化已经不能满足结构设计领域多样性和多元
药品是人类用来与疾病斗争的重要手段之一,药品质量的优劣直接关系到防病治病的效果,以及用药患者的安全,国家和消费者都非常重视药品的质量和安全问题。本课题的研究对象玻
灾后心理重建,是指在灾害发生后灾民心理状况上出现较为严重的问题时,针对个人或家庭制定改善方案,调整心理问题,为灾民恢复心理平衡增加重建动力,包括物质干预和心理干预两
边界层低空急流对热量、水汽、污染物的输送起重要作用,与暴雨等强对流天气等密切相关。本文利用2016-2017年北京常规探空数据,选取1、4、7、10四个典型月份对北京边界层低空急流季节特征进行初步分析。利用6、7、8月数据分析夏季急流昼夜特征差异,结合2016年8月27-9月2日北京宝联、朝阳、大兴3个站点的边界层加密探空试验数据,对该地区夏季边界层低空急流日变化特征进行分析。结果显示:(1)北京
近几年来,在我国建筑工程施工技术水准持续提高的背景下,我国的建筑工程水电暖通安装施工的技术也随着获得了较大的进步,而且建筑工程水电暖通的施工质量基本能够充分的满足
在现实生活中缺失数据问题经常发生,如医药研究、工业生产等领域常发生数据缺失现象.在处理带有缺失数据的问题时,不能直接用通常的统计方法来进行数据分析,需要先补全缺失值,从而得到“完全样本”,再按照通常的统计方法进行推断分析.经验似然是一种非参数统计推断方法,它有类似于bootstrap的抽样性质.与传统的统计方法相比,该方法具有许多优良性,如该方法构造的置信区间即有域保持性、变换不变性,又有置信区间
邮轮旅游自2006年进入中国旅游市场,十几年间经历了从萌芽期、快速增长期到战略调整期的发展阶段,并获得了越来越多消费者的认可和追捧,为我国海上旅游业开辟了一条新道路。