视觉物体分类中局部特征建模方法研究

来源 :武汉理工大学 | 被引量 : 3次 | 上传用户:www_52810_com
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
视觉物体分类是图像检索、海量视频数据应用、视觉感知替代、自动机器人和交互式游戏等应用中极具挑战性的关键技术,具有广泛的应用需求和重大的应用研究价值。视觉物体分类的研究目标是发现图像中的物体并决定其所属类别。本文在视觉词袋模型框架下,研究视觉物体分类中的局部特征建模方法,包括局部特征线性编码、池化方式以及空间匹配方案,并给出了相应的改进方法,主要工作及创新点如下:(1)提出了局部约束主成分线性编码方法。从分析局部特征与K个近邻视觉单词的线性相关性和检验局部线性编码模型的显著性着手,指出引起局部线性编码模型中单个权重系数不显著的根本原因为K个近邻视觉单词之间的复共线性。为此,给出主成分估计的改进办法,该方法解决了复共线性带来的不稳定、均方误差大的问题。在Caltech-4图像数据集上的视觉物体分类实验结果表明,该方法提高了视觉物体分类正确率。(2)提出了基于视觉词汇主成分的局部约束线性编码方法。通过分析发现局部约束主成分线性编码方法在解决复共线性问题的同时也增加了编码过程的时间开销。针对该问题,本文将对于每个局部特征的K个近邻视觉单词的主成分的确定简化成对视觉词汇只做一次主成分确定,视觉词汇主成分的数量根据累积贡献率而定。实验结果表明,基于视觉词汇主成分的局部约束线性编码方法将线性编码时间减少了1/3;当累积贡献率为85%,视觉词汇主成分个数为20时,基于视觉词汇主成分的局部约束线性编码方法的性能是最优的,综合考虑了编码时间和分类效果;本文提出的两种线性编码方法在每种池化方式下都提高了分类正确率,并且它们的分类正确率相近,证明基于视觉词汇主成分的局部约束线性编码方法在减少时间开销的同时,保留了局部约束主成分线性编码方法的优点。(3)针对目前局部特征建模中引入空间位置信息的空间金字塔匹配方法缺乏对图像中视觉物体平移、缩放和旋转的考虑,本文提出一种基于视觉词汇形状描述模型的空间匹配方法。该方法相对于每个视觉单词的几何中心建立空间几何模型,保证平移不变性;给出对数极坐标空间金字塔匹配,对对数极半径和极角做等比例划分,保证缩放不变性;并在空间金字塔划分过程中确定极角的主方向,从而保证旋转不变性。分别在Caltech-4数据集和自建图像数据集上对该方法进行了验证和比较。实验结果表明,该方法提高了分类识别正确率,特别是对于包含明显平移、缩放和旋转变化的图像数据集;而且该方法的方差变小,说明其鲁棒性更强。(4)在研究局部特征线性编码方法的基础上,讨论局部特征编码的池化方法,引进指标规范化。在Caltech-4数据集上的实验结果表明,引入的指标规范化降低了局部特征描述模型向量的稀疏性;明确了局部特征描述模型向量的稀疏程度对分类结果的重要影响。(5)综合本文提出的有关局部特征建模的方法进行综合实验。Matlab环境中的实验结果表明,Caltech-101图像数据集上本文方法的平均分类正确率(ACA)高于其它5种流行方法;Pascal VOC2007图像数据集上本文方法在没有考虑多种局部特征融合以及采用线性SVM分类器的情况下,平均查准率(AP)接近于Pascal VOC2007竞赛的最好分类结果。最后实现了一个基于C/S架构的视觉物体分类系统原型。
其他文献
交易型受贿是指国家工作人受在从事商品交易中利用职权通过获取差价优惠商品来收受对方给予的贿赂,不同于一般的正常优惠购物,认定中应以优惠价与市场价格的差别作为判断得到优
改革开放以来,美国跨国公司在中国的投资,无论是规模、总量,还是分布的行业、地区,都取得了飞速发展,所以认清跨国公司对中美经贸关系所产生的影响与作用,对中国无论是积极利
阴道超声检查指将探头直接放置在阴道内进行超声检查的一种方法,具有探头频率高,观察部位位于声速近场,检查无需充盈膀胱,肠气干扰少,图像清晰等优点。阴道彩色多普勒超声在
开征环境税将成为今后政府重点推进的税收政策之一,也体现了对现有税种进行“绿化”的迫切需求,即通过对现有税种的改革和完善,充分体现环境保护的要求。本文通过对现有资源税如
目的探讨冠状动脉粥样硬化患者睡眠质量情况及对相关因素进行分析。方法选取178例冠状动脉粥样硬化患者为研究对象。采用问卷调查的形式对患者进行睡眠质量调查,并对影响患者
文章简述了集装箱的历史背景、发展现状、特点;分析了作为设计空间的优势、作用及设计的潮流方向;并且在此基础上阐述了室内装饰设计与集装箱的融合情况,以及室内装饰设计中