论文部分内容阅读
近两年来,互联网搜索空前发展,搜索内容早已超越了网页搜索的限制,音乐、图像、视频等复杂信息的搜索大量涌现,因此对图像信息的检索技术得到了大规模的应用。目前,主流搜索引擎都采用基于文本的图像检索技术,寻找一种关键字为线索、资源开销较小、搜索结果较好的基于内容的图像检索技术以适应互联网图像搜索发展的需要,有很现实的意义。本论文的实现了一种实现成本较低的伪语义的基于内容图像检索系统,文中称为“面向互联网搜索的图像检索技术”(Internet-oriented PictureRetrieval Technique),简记为IPRT。属性论是由冯嘉礼教授提出的,以辨证唯物主义质变量变规律为指导的,人工智能方法。它通过对象的量特征和质特征了解其本质,并在定性映射的基础上提出了一系列的模式识别、机器学习、评估决策等方法。本文在IPRT系统的特征抽取算法设计时借鉴了属性论方法,并在检索用户的心理偏好学习中采用了“属性坐标分析法”。本文的工作主要体现在如下几点:1、提出了“伪语义”检索的概念,即改良了传统的CBIR中用户操作流程。设计并实现了完整的IPRT图像检索系统,该系统是对颜色、纹理、形状和草图四种图像特征整合检索的CBIR系统,拥有较好的查准率、查全率和执行速度;2、对图像特征提取算法进行了改良。颜色、纹理、形状和草图各特征提取过程采用了更符合人类视觉的HSV颜色空间表示,并将它划分为18×3×3个层次,不仅包括了色彩信息,而且比传统的256级灰度表示维数更低。将特征提取的算法复杂度控制在O(M×N)以内;3、针对图像形状、草图特征提取,本文分别提出了“三层轮廓法”和“简单分块差分法”。这两种方法具有运行效率高、鲁棒性好的特点;4、本文运用“属性论”中的“属性坐标分析法”,记录用户检索图像过程中的操作行为,并从中提取出检索用户的心理偏好。该心理偏好可以为检索用户提供更满意的检索结果;5、对心理偏好的学习引入了反馈机制,使搜索结果可以不断逼近用户的期望。