图像语义标注方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:die0410
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像数据的爆炸式增长亟需有效的检索方案。传统基于周边文本和基于内容的图像检索技术本身存在局限性,而图像语义标注技术通过给图像自动添加能描述其语义内容的文本标签,有望为两者带来突破。随着图像语义标注技术的逐步应用,其研究场景呈现出标签空间高维化、图像数据海量化、标注环境复杂化等新特点,给已有的基于模型和数据驱动的方法以及领域本身带来了诸多挑战,包括高维标签空间下模型方法的训练成本过高问题、海量图像数据中数据驱动方法的视觉近邻快速检索与信息挖掘问题、复杂标注环境下的图像标签补全问题等。本文针对上述挑战,分别提出了合理有效的应对方案,其主要贡献包括:1.针对高维标签空间下模型方法的训练成本过高问题,提出了一种特征相关的标签空间隐式编码算法,用于高维标签空间的降维,以减少所需基本预测模型的数量。该算法去除了对降维过程的显式假设,直接学习降维结果,并且同时考虑了降维结果的可预测性和原始标签空间的可恢复性,能够在有效降低模型方法训练成本的同时减少标注性能的损失。2.针对海量图像数据中视觉近邻的快速检索问题,提出了一种保持语义相关性的哈希算法,将图像特征映射为二进制哈希码,并通过高效的比特运算计算图像间的汉明距离。该算法将语义空间和汉明空间中的图像相关性分别建模成概率分布,并最小化两者的差异,学习出能保持语义相关性的汉明空间,进而学习出将图像特征映射到该汉明空间的哈希函数。算法在高效检索的同时能保证较高的近邻相关性,且适用于单特征、多特征和跨特征检索。3.针对视觉近邻的信息挖掘问题,提出了一种基于标签相关随机搜索的近邻挖掘算法,用于为不同待标注图像和候选标签自适应地选择近邻。对于待标注图像,该算法通过标签相关的随机搜索过程,挖掘出各个候选标签对不同近邻的信任度,进而结合近邻权重和近邻投票等对其进行相关性预测。算法在获得较好标注性能的同时降低了对近邻数量设置的敏感度。4.针对复杂标注环境下待标注图像存在初始标签的情况,提出了一种基于图像和标签双角度线性稀疏重构的标签补全算法。该算法结合图像特征、初始标签等信息,分别从图像和标签的角度出发,通过线性稀疏重构挖掘和整合多种上下文关系信息用于图像标签的补全,取得了良好的实验效果。
其他文献
所谓VIE结构,实质上是在保持公司股权结构稳定之下,外资股东通过设立SPV以及特殊协议曲线获得企业的经营控制权。在运作机制上,VIE结构通过多层次的协议架构境外上市主体、境
从网络技术的发展趋势看,软件定义网络已经成为促进网络创新和重构网络体系的最重要推动力之一。软件定义网络具有的转发与控制分离、基于全局视图的集中控制等特点,显著提高
实验教学是整个教学过程的重要组成部分,实验教学同样也是巩固知识、提高操作技能的必备环节。通过加强实验室管理,突出教学仪器设备的基础功能,实验教学环节的关键作用和实
目的了解临床产科护士核心能力培养的现状与需求。方法为制定产科护士在职规范化培训方案提供客观依据方法采用自行设计的调查表,对我医院的32名产科护士进行了调查。结果有5
<正> 杰罗姆·艾伦德(Allender·J·S)是美国天普大学(Temple University)心理教育过程系主任,主攻教育心理学,偏重教法与学习理论。他的夫人唐娜·艾伦德创办了一所特殊实验
高新技术企业正逐渐主导世界产业经济发展的大趋势,在高新技术企业迅速发展的过程中,成本管理起着重要的作用,高新技术企业与传统企业相比,在成本管理方面存在许多不同之处。
复杂多样的数据类型为数据查询处理带来了前所未有的挑战,单纯依赖机器处理大数据通常难以获得高质量的结果。近几年,随着众包技术的不断发展,借助于众包实现数据查询处理已
<正> 三、关于马德里议定书第9条之6,即所谓"保护性条款"的重大修改法律问题剖析1.历史背景在2007年9月24至10月3日召开的马德里联盟第38届大会上,对马德里议定书第9条之6(1)
<正>1992年8月18日,美国王安电脑公司向法院提出破产保护的申请。消息传来,全球为之震惊,在国际电脑界更是掀起轩然大汉。国际电脑界巨头IBM公司、数字设备公司、通用数据公
本文对“外国语言学及应用语言学”这个说法进行思考。首先对语言学的分类进行简单的回顾,把“理论语言学”和“应用语言学”、“普通语言学”和“个别语言学”进行简单的区