论文部分内容阅读
随着计算机以及通信技术的发展,图像处理被广泛应用于各个领域。伴随着大规模图像数据库的产生,传统的信息管理方式已经不能满足实际的需求。为了便于图像的检索和识别,基于内容的图像检索(Content-Based Image Retrieval,CBIR)技术应运而生,并成为图像领域研究的热点问题之一。基于内容的图像检索是从图像本身的内容出发,由计算机提取图像本身所包含的颜色、纹理、形状等信息,通过这些信息对图像数据库进行检索,以满足用户对大量图像的检索要求。本文以基于内容的图像检索为主线,对检索系统的结构和关键技术进行了总结,并在图像聚类策略、路由机制等两个方面作了深入的研究。由于图像的特征矢量往往是多维的,加之传统的索引结构不能适应于多维特征的索引,因此,如何有效地索引且快速查询图像数据库是基于内容的图像检索的一个重要的研究问题。目前大部分图像检索系统,包括有名的QBIC,Visual Seek等,均为集中式架构,如何将网络上分散的图像资源充分利用起来,是本文考虑的第二个主要问题。基于以上两点考虑,我们充分利用DHT的资源定位的准确性和快速性以及TS-SOM(Tree Structured Self-Organzing Maps)在聚类方面具有的无监督、自组织和稳定性高等优点,形成本文中的DTS-SOM(Distributed TS-SOM)。实验结果初步证明了该方法的可行性。如何将DHT(Distributed Hash Table)用于CBIR中进行基于语义的查找,我们做了以下工作:Yingwu Zhu在其基于语义的检索系统中,组hash函数使用固定的m和n对文件进行哈希,试图将相似性较大的文档D哈希到相同的节点中,以减少访问节点的数量,降低网络开销。但是当文档D相似度变化范围较大时,上述方法很难得到满意的结果。针对此问题,我们充分利用了CAN(Conetent Addressable Network)中邻居网格具有更高的语义相似性这一特征,引入了cache策略,来计算文件相似度,进而获得优化的m和n。理论证明此方法是可行的。