论文部分内容阅读
随着网络技术和多媒体技术的快速发展,网络上的数字图像资源日益丰富。但是,人们往往很难从这大量的图像资源中找到他们所需要的图像。而图像检索能帮助人们解决这个困难。因此,近年来,网络图像的检索成为多媒体信息检索的研究热点之一。图像检索技术可以分为基于文本的图像检索和基于内容的图像检索。在基于内容的图像检索中,图像中的对象常常是人们感兴趣的检索内容。一幅图像中包含什么样的主体对象,人类很容易识别,但对海量的Web 图像全部进行人工对象识别,标注并入库以供检索使用,工作量巨大,几乎是不可能的。本文基于人对图像对象的识别过程,建立图像对象的视觉特征知识库,通过计算机对图像对象的视觉特征提取与识别,结合图像对象的视觉特征知识库,识别图像对象,并用于基于对象的图像检索中。本研究包括图像识别过程和基于对象的图像检索算法。其中图像识别过程又包括三个主要方面——图像分析、知识库建设、对象识别。图像的分析包括图像分割、视觉特征提取、Web 页中对象名及其视觉特征词提取等。本文采用边缘分割和聚类分割相结合的方法对图像进行分割,取得了较好的分割效果。采用直方图法提取图像对象的颜色特征;利用小波变换提取图像对象的纹理特征,用不变矩等提取图像对象的形状特征,并用BP 神经网络对纹理和形状特征进行识别;利用中文自然语言处理技术提取图像所在Web 页的图像对象名和视觉特征描述词等。图像对象的视觉特征知识库建设是对象识别的基础。本文采用“与或式”描述法,建立对象视觉特征知识库,其中包括了对风景图片中191 种常见自然物、动物等对象的描述。本文研究的重点是图像对象识别,通过计算图像中提取的某区域的视觉特征与知识库中各对象的视觉特征的相似度来确定此区域对应的对象名。我们认为,图像所在Web 页中包含的对象名可能指图像中的对象,因此,为了提高识别速度和识别准确率,本文仅对图像中可能包含的对象进行相似度计算。