论文部分内容阅读
随着高分辨率数码设备和海量存储系统的普及以及网络传输带宽的增加,图像数据正以指数级的速度增长。如何有效管理如此大规模的海量图像数据库,以便用户可以快速而有效地找到他们感兴趣的图片是一项极具挑战的任务。由于语义鸿沟的存在,传统的基于内容的图像检索技术(Content-based ImageRetrieval,CBIR)往往不能很好地满足图像语义检索的要求,同时普通用户也无法将自己的检索需求以CBIR系统中底层视觉特征的形式表达出来。为了实现有效的图像语义检索,同时提供用户友好的文本检索接口,对图像进行人工标注是一种可行的方法。然而,由于人工标注过程费时费力而且极易出错,面对海量图像数据,完全地人工标注无法成为现实。人们迫切需要一种可以自动或者半自动对图像进行语义标注的方法。因此,图像语义标注(Image SemanticAnnotation)具有十分重要的理论与实践意义,引起了学术界和工业界的高度关注。传统的基于内容的图像语义标注模型往往仅仅依靠图像本身的视觉内容来完成标注任务,而忽略了标注过程中标注词之间的相关性信息,其标注性能仍有待进一步提高。此外,随着Web2.0时代的到来,越来越多的Web图片被用户用语义标签进行在线标注,这些大量标注过的图片同时也为开发新的自动标注工具提供了新的机遇。本文围绕图像语义标注和在线标注的特点,集中利用标注词之间的相关性信息,对如何将标注词相关性信息整合到标注过程中、如何实现内容无关的标注词推荐以及如何更有效地利用用户标注词和图像视觉内容为图像语义标注服务三方面展开研究,提出了三种不同的图像语义标注方法,如下所示:·提出基于语义概念上下文的渐进式图像自动标注方法:同时利用语义概念的上下文信息和图像的视觉信息来对图片进行自动语义标注。在这个渐进式的标注框架中,标注以增量式的方式一个接着一个地加入到图片的标注词集合中,每一次标注词的选择不仅仅取决于当前给定图像的视觉信息,还取决于以前已经加入到标注词列表中的已有标注词。换句话说,标注词的选取是利用图像视觉内容,并基于改图片已有的标注词集合这个上下文信息的,实现了以较小的计算代价将标注词之间的上下文信息融入到基于内容的标注系统中的目的。·提出基于协同过滤的标注词推荐方法:将协同过滤(Collaborative Filtering)技术应用于标注词推荐。协同标注词推荐(Collaborative Tag Recommendation,CTR)方法是不依赖于图像视觉信息的标注词推荐方法,仅仅利用图像当前已有的少量用户标注来实现为图像推荐更多的相关标注词的功能。协同过滤技术被用来发掘标注词之间的关联模式,并利用这种关联信息产生标注词推荐列表。·提出基于内容和标注词辅助信息的图像标注方法:把图像语义标注看作是一个标注词推荐问题,将图片已有的少量用户标注词和图像的视觉内容通过一个概率模型HPM(Hybrid Probabilistic Model)融合在一起,从而实现图像的语义标注功能。对于没有用户标注词的图像,HPM仅仅根据图像的视觉内容信息预测标注词。对于具有少量标注词的图像,HPM同时利用其视觉信息和标注词信息来推荐额外的标注词用于标注该图片。此外,我们还使用协同过滤算法来解决标注词共生概率估计时遇到的数据稀疏问题。