论文部分内容阅读
测量商标图像的知觉相似性并为其定义适当的相似度测量准则存在很大的不可预见性。大多数学者使用欧式距离或者Hausdorff距离。
任意两个p维向量的欧式距离被看作其幅值上的特征,而不是相关性特征。当使用欧式距离和Hausdorff距离作为测量方法时有两个主要缺陷:第一,数值大的特征倾向于起主导作用;第二,当图像采用不同的变换时,使用同一的测量方式会影响检索结果。尽管hausdorff距离在图像匹配中起着重要作用,但是当其被使用时不得不对噪声、遮挡进行预处理。从另一个角度来看,计算图像Iq与Is所有像素点间的hausdorff距离是耗时的。
构建一个优秀的基于内容的图像检索系统有三个要素:首先,选择一个优良的相似度准则;其次,利用相似度准则对图像特征进行分类;最后,从图像中提取图像特征。在本文提出的基于形状的图像检索系统中,归一化的余弦和欧式距离被用于商标图像的检索。
与其他特征提取技术不同的是,本文提出的测量准则考虑了图像全局特征(矩不变量和偏心距)与局部特征(熵直方图和距离直方图)。同时,两个重要问题被发现:其一,许多研究人员专注于使用单一的图像特征,比如使用傅里叶描述子、矩不变量或者Zemike矩,而不是复合使用多种特征用以得到更好的检索结果;其二,即使他们复合使用了形状特征,多种形状特征的权值因子通常被静态地设置。
为了减少搜索时间和检索范围,数据库中的图像被编制索引。被选中图像的熵落入闭区间[0,0.5]或[0.5,1]。接着,使用似然函数计算检索图像与数据库图像的相似度。检索效率等式被用于测试本文算法的检索精度。一种基于归一化Hausdorff距离的新相似度准则被提出用于精确、鲁棒的商标检索。基于子图的商标检索方法、极坐标系统和遗传算法被用于本文的算法。对商标图像进行归一化后,商标被一圆周包围用以确定其范围。然后圆周内区域在极坐标下被划分为子块,计算其形状直方图。通过大量的商标图像检索实验,使用机器学习的方法计算出相异度函数中的权值因子,遗传算法被用于确定权值因子的分布。
仿真实验结果表明,当采用标准化Hausdorff距离时,系统所选出的最匹配的前20幅图像的非检索率均为0,这说明本文所提出的方法能够较完备地检索出所有最匹配的商标图像。因此,采用标准化Hausdorff距离来进一步分析cosine和欧式距离的结果能够获得较好的检索性能。设K代表最少有幅图像被判定为匹配图像,当K=10时,检索率下降4%;当K=15时,检索率下降8%;而当K=20时,采用直接的未标准化的Hausdorff距离判定方法,检索率将有显著的下降。而实验结果标明,如采用标准化的Hausdorff距离,即取欧式距离和cosine距离的最小值,将获得比采用直接的Hausdorff距离更好的检索结果:图像的检索缺失率将从20%下降到2%。因此,实验结果标明,标准化的Hausdorff距离能够很好地改善商标图像检索的正确率,同时由于算法考虑了图像形状的不变性,具有较好的鲁棒性。系统给出最匹配的前20幅目标图像,且按匹配度的高低依次排列。本文算法所采用的相似度函数符合人类视觉特性,在商标图像检索方面体现了较好的检索特性。