论文部分内容阅读
随着多媒体技术的发展,包括图像、音频、视频等信息的多媒体数据大量涌现,如何从大量的信息中快速,有效地检索到所需的内容,已经成为多媒体技术研究中的热点问题。图像检索自七、八十年代始便成为一个非常活跃的研究领域,其推动力来源于两大研究团体:数据库系统和计算机视觉。它从基于文本以及基于内容这二个不同的角度,对图像检索作了研究。另外多媒体内容描述标准MPEG-7也正在制定当中。 基于文本的图像检索,其研究主要在数据库领域中进行,图像检索的一个典型框架是,首先对图像用文本进行注解(关键字),然后用基于文本的数据库管理系统(DBMS)来进行图像关键字检索,诸如数据模型、多维度索引、查询评价等的研究进展均是沿着这一领域所作的。但是,基于文本的图像检索存在两大困难,尤其是当图像的数量非常大的时候,其一是手工对图像进行注释所需的工作量太大,其二是图像注解的主观性和不精确性可能导致的检索过程中的失配。九十年代初,由于大规模图像数据库的出现,由手工进行图像注解这一方法所带来的困难变得十分尖锐,为了克服这一困难,研究者们提出了基于内容的图像检索,其思路是,不同于基于关键字的手工注解,图像是由其自身的视觉内容,如颜色、纹理、形状、视觉含义等索引的,这便是基于内容的索引。 基于内容的图像检索系统,根据图像库的内容和检索要求可分为通用检索系统和专用检索系统。专用检索系统是由图像库和检索要求的特殊性而研究的专门检索技术,如专门的人脸图像数据库检索;而通用检索系统所采用的技术则较为普遍。目前,对于通用的图像检索,用于检索的特征主要有颜色(Color)、纹理(Texture)、形状(Shape)、草图(Sketch)等,其中颜色、形状、纹理应用最为普遍。由于不同的应用背景,不同的基于内容检索系统在其检索实现中采用的技术也各有侧重,但一般都能在传统的计算机视觉利图像处理技术中找到其出处,所以基于内容的图像检索可以说是图像处理和计算机视觉各种技术应用的综合。 在多媒体特别是图像信息管理和存取领域,论文主要关注于基于内容的图像信息检索方面,阐述其理论、方法和体系结构,提出内容描述模型和基于内容的检索算法,并给出实验结果和测试分析。考虑到图像本身的特性,建立起图像数据的内容描述模型,以使得能更好的进行图像数据库存取利索引。颜色,纹理,形状是描述图像内容的重要特征。在图像特征提取和相似性匹配方法中运用了多种有效算法,比如在颜色特征的基于颜色感知的图像检索算法;在纹理特征抽取中的基于非完全树小波包变换技术的算法等等。同时,根据结合图像的二维空间位置信息,对图像的某个局部位置(用户感兴趣区域)信息来进行检索。在检索系统的人机交互中运用了相关性反馈Relevance Feedback,使得能更有效,快速的检索到所需的图像。在论文中,本人主要对基于内容的图像检索系统有关颜色的算法和相关性反馈方法进行了实现,给出了测试和实验结果,并进行评价和讨论。实验结果发现,系统能较有效,快速的检索较大规模的图像数据库。