论文部分内容阅读
在过去的几十年里,传统的关系数据库管理系统在商业数据管理中发挥了非常重要的作用。但是,近年来随着计算机应用技术,特别是Web信息技术的不断发展,当今的数据呈现出了两大特点,即海量和共享,而且数据特征多样化,人们面临的传统的结构化数据越来越少,而非结构化数据图片、音频、视频、文档等大量涌入了人们的生活中。对于数据出现的这些新的特点,传统的数据库管理技术已经显得无能为力。为了解决这一问题,数据空间这一概念应运而生数据空间可以解决个人数据管理中存在的查询效率低、如无法处理非结构化数据、不支持对数据库的关键字查询和无法进行关联查询等问题。在这种背景下,本文对数据空间系统中的基于内容的图像索引技术进行了进一步的研究。在原有的高维多特征索引M2-tree的基础上,设计出更加有效地高维索引技术M2+-tree。M2+-tree中提出了关键向量的概念,在对基于距离进行空间划分后,又根据关键向量进行了第二次划分。在M2-tree上进行范围查询和最近邻查询的时候,只根据三角不等式进行过滤,而在M2+-tree在三角不等式过滤的基础上,又进行基于关键向量的第二次过滤,可以过滤掉许多一定不包含结果的查询路径,提高查询的性能。本文还提出了M2+-tree的批量构建算法,批量构建算法可以提高构建M2+-tree索引的效率和性能。最后,利用M2+-tree索引,在数据空间系统Mydataspace中,实现了对图像基于内容的检索。在这个系统中,提供图像特征的提取,创建M2+-tree索引以及用户的查询界面。用户可以通过输入样例图像查询到数据空间中与之相似的图像。