论文部分内容阅读
随着多媒体技术和互联网技术的高速发展,互联网信息,不仅包含简单的文本数据,还包括大量的音频、图像、视频等多媒体信息。如何对大量的图像信息进行有效的管理并从中高效地检索到需要的图像已成为急需解决的问题,为了实现快速而准确的图像检索,基于Web的图像检索技术应运而生,并成为图像分析领域的研究热点之一。目前已经有不少的搜索引擎在提供网络图像的检索服务,如Google、Baidu、Soso、Ditto、PicSearch、Ixquick、Mamma等,但是这些搜索引擎对图像检索都采用基于关键词或描述性文本的检索方式,从本质上来说是一种基于文本的图像检索技术。这类检索技术最终将转换为对数据库中文本的检索,其优点是文本数据库检索理论已非常成熟,但存在一个致命的问题是需要对图像进行文本标注,标注工作量巨大,并且还存在“语义鸿沟”的问题,即图像的低层内容特征不能有效地描述高层语义问题。通过对国内外研究现状的分析,在已有研究工作的基础上,本文围绕基于内容的Web图像检索中存在的若干关键问题,从常见视觉特征的图像检索技术、图像特征选择、图像降维方法和图像相似性等四个方面对基于Web的图像检索技术展开了研究。本文的主要研究工作和创新点可概括如下:①研究并分析了图像检索技术中存在的问题,介绍了基于视觉特征的图像检索的常用技术,为后续Web图像检索技术的研究做了铺垫。②针对传统遗传算法在求解图像特征选择优化问题可能存在“早熟”或局部收敛等不足,在自适应遗传算法研究的基础上,将并行计算的原理应用于遗传算法,并对变异算子、交叉算子进行改进,提出了基于随机概率算子的双种群自适应遗传算法,并将其成功用于图像特征选择优化,改善了图像特征选择的性能。③提出了一种利用HSV颜色模型提取图像主色的图像降维算法。将RGB颜色模型转换为基于视觉感知的HSV空间,然后对图像进行HSV特征72维量化,同时按每维上的特征值从大到小进行排序,按照一个阈值,取前d个维数作为图像的本征维数,从而达到快速降维的目的。研究表明,这种降维方式无需事先指定需要降维的维数,能较好地利用图像本征维数,达到降维的目的。④提出了一种基于区域Shannon互信息的图像相似性度量方法。在Shannon熵、联合熵、条件熵的基础上,将图像之间的Shannon互信息作为相似性度量函数进行图像相似性度量,针对Shannon互信息需要进行三次归一化处理、计算量偏大的问题,引入图像的空间位置,对Shannon互信息的计算进行了改进,减小了图像互信息的计算工作量,提高了图像检索的性能。⑤对面向Web的图像检索系统模型框架进行深入研究,初步搭建了基于图像内容的图像检索系统平台,将检索系统分为界面设计、网络蜘蛛、图像预处理、图像特征提取、图像特征选择、相似性度量和相关反馈等部分。在现有文本搜索引擎的基础上,添加图像搜索功能,建立72叉树作为图像索引和分类,实现了Web页面图像的抓取、数据库存储和相似性度量的过程,真正意义上实现了基于目标图像的Web图像检索。