基于图编辑距离的自然景物识别

来源 :北京工业大学 | 被引量 : 2次 | 上传用户:yantianwa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像识别是模式识别领域的一个重要分支,鉴于其在医学、航空航天、工业等众多领域的广泛应用和重要作用,图像识别一直作为研究人员的研究热点。而其中的一个重要分支——自然景物图像识别由于其分类的多样性和模糊性更是图像识别领域的难点之一,始终未能形成一套明确、统一的分类识别体系标准。自然景物图像的描述及特征的提取在识别过程中起着至关重要的作用。但是由于自然景物图像内容的多样性,及其对光照、图像尺寸等因素的敏感性,传统的单一特征图像描述方法受到严格的限制。在总结前人的研究经验的基础上,提出了一种基于图编辑距离的自然景物图像识别方法。该方法运用了多特征融合技术,综合考虑了自然景物图像的颜色、形状、纹理等多项特征,有效避免了光照、图像尺寸等因素对识别过程的影响。在各项特征提取的过程中分别采用了MPEG-7标准下的主色描述符和边缘方向描述符。在自然景物图像的描述中,采用了一种图像的属性图表示方法。该方法首先把自然景物图像分为若干区域;然后选择其中对识别过程有意义的几个区域根据上述方法分别提取每个区域的多项特征,将各个区域抽象为顶点,提取的该区域的特征作为顶点属性,相邻区域所对应的顶点之间连一条边,这样就可以将自然景物图像表示成属性图。自然景物图像的属性图表示模型建立之后,两幅图像之间相似度的度量问题就转化成了属性图的匹配问题。最后,利用图匹配算法计算所有自然景物图像之间的相似度,构造相似度矩阵。在此基础上,利用扩散核函数把相似度矩阵转化为图核,并代入支撑向量机(SVM)进行图像的分类识别。研究内容主要包含以下三个方面:(1)研究自然景物图像的描述方法,总结传统自然景物图像描述方法的优缺点,并结合图像的属性图表示法,提出一种适用于多类自然景物图像识别算法的综合性图像描述方法。(2)定义合理的编辑代价函数,利用图编辑距离算法把自然景物图像之间的相似度度量问题转化为属性图的匹配问题,进而求得自然景物图像对应的属性图之间的相似度。(3)研究核方法在图领域的应用,学习图核的构造方法,从中选择一种适用于基于图编辑距离的自然景物识别算法的核函数,并加以改进。最后,分别对含有城市和乡村的两类自然景物图库及含有高速公路、城市景色、高楼大厦、海岸、森林、山脉、街道、野外景色这八类自然景物的图库进行了实验,实验结果表明基于图编辑距离的自然景物识别算法通用性较强,并对光照、图像尺寸等外部条件均有较好的鲁棒性,且识别结果较为理想。
其他文献
学位
面部表情在人与人之间的交流上有重要的作用,人脸表情相对文字、语音等媒介在表达人的情感、情绪方面具有更加直观、准确的优势。将自然人这种情感交互模式用于如虚拟远程教
在计算机技术飞速发展的今天,基于网络环境的各种应用系统层出不穷,这些应用系统大多都要针对大量的数据进行处理。在早期的开发过程中,人们对于不同应用系统间共享数据未予关注
基准剂量评估通过把实验获得的剂量——反应数据和数学模型拟合推导健康风险评估的起点,是一种统计学意义上的风险评估方法。首先研究了基准剂量计算的实验设计。目前进行剂
随着网络信息的快速增长,搜索引擎的作用越发的重要。而为了进一步处理和挖掘网络日渐增长的庞大信息,搜索引擎本身也相应地要寻求某些除了简单的网页文本以外的载体。网络表格
聚类技术作为数据分析中的重要手段,在信息爆炸的现代生活中变得越来越重要。为了获得符合常识的信息,人们对数据进行总结和归纳,利用自身的经验将数据聚类为知识。如今,在各
视频监控技术在当今时代得到了长足的发展和广泛的普及。然而当前的视频监控技术相比以往虽然大量节省了人力并提高了效率。但是其通知方式并没有较大的革新,仍然需要专门的监
本文主要研究基于无序图像集的三维场景和相机参数恢复技术。研究的目标是利用结构运动恢复技术从二维图像恢复三维场景的结构信息以及相机的参数。本文工作的主要内容概括如
在机器学习的研究中,人脸识别是一个热门的研究问题。人脸识别系统的一般模型又分为人脸检测,特征定位与提取和识别分类三个步骤,其中特征定位与提取又是整个人脸识别算法的基础
多视点视频作为下一代多媒体应用的发展方向,通过提供多个视点的视频数据来满足用户自由选择观察角度的需求,具有立体感和交互操作的功能。多视点视频的数据量通常随着摄像机数