基于草图和边缘的物体识别

来源 :北京邮电大学 | 被引量 : 3次 | 上传用户:fencer_20
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
草图从远古时期就作为描述客观世界的一种有效方式,随着当今移动触摸屏设备的快速普及,人的手画物体草图识别研究逐步引起了极大的关注。分类和识别人的手画草图是解决计算机视觉领域的许多重要应用问题的基础,如基于草图的图像检索以及人机交互等。另外,物体识别是计算机视觉的一个基本问题,物体位置预测(object proposals)被看作是物体识别的一个关键步骤,能极大的提高物体检测与识别的效率。本文围绕以上相关关键问题进行研究,具体包括草图自动生成及其在基于草图的图像检索技术中的应用,草图物体识别,以及物体位置预测。本文提出了一种感知编组算法用于高效解决草图的自动生成问题,这一问题旨在将真实图像转换为类似于人的手画草图的形式。具体来讲,本文研究了如何将多种格式塔规则融合到统一的感知编组框架下,用于草图的自动生成。进一步的,本文提出一种解决格式塔规则的竞争现象的方法,引入了格式塔规则相对重要性的概念,用来优化草图自动生成算法。并且提出了一个有人工标注的包含96个类别共7680张草图的数据集,用来学习格式塔规则的相对重要性。另外,本文提出了一种新的评价自动生成的草图质量的方法,即以用真实草图训练得到的分类器是否能较好的分类自动生成草图作为评价其质量的度量标准。随后,所提出的一种新的基于草图的图像检索算法进一步验证了草图生成算法的实用性和有效性。对于草图物体识别这一重要问题,和处理物体识别任务一样,大部分前人的工作都遵循标准的有监督的学习算法来训练分类器从而识别草图物体的类别。其中最重要的问题之一就是如何有效的提取草图特征,即草图的特征表达问题。本文提出了一种基于块的稀疏表达算法来作为描述草图的特征,这是首次将稀疏编码应用于草图物体识别。在一个大规模草图数据集下的草图物体识别实验结果验证了所提特征表达方法的有效性。然而,几乎所有草图物体识别算法都假定有足够的训练数据可用,因此这些算法对于训练数据敏感度较高,并且不能对新类别草图物体的识别有所帮助。为了解决这一局限性,本文提出了一种迁移学习算法,能够只用一张草图作为训练数据来分类对应类别的草图物体。具体的,本文提出了一种基于互约束的稀疏表达算法,可以从已知的草图类别数据中挖掘通用或可替代的草图物体部件,并将这些通用部件信息迁移到新类别草图分类器的学习中。实验结果表明本文所提算法大幅提高了其他算法在相同训练数据下的草图物体识别准确率。最后,本文优化了前面提出的感知编组算法,用于将图像边缘组织成有意义的结构,并证明了这种边缘编组结构在物体位置预测问题上的有用性。所提出的感知编组算法将边缘编组问题模型化为一个图分割问题,并采用学习并排序(learning to rank)的策略来预测任意边缘对被编为一组的概率。随后,基于感知边缘编组算法,本文又提出了一种新的物体位置预测算法,并与目前最好的一系列算法的比较结果证明了所提算法的有效性。
其他文献
阐述了上芽始见期、6月-7月上旬的气温及降雨量是影响山楂叶螨主害代发生的主要因素,可作为预测预报的重要依据;论述了越冬基数、天敌和果园管理对山楂叶螨的发生也有一定影响,
<正> 乙肝病毒携带者(ASC)临床多见。近几年来,通过反复探究,几经临证得失,终于悟出,ASC系指由于机体正气特别是肾阳的不足,导致属于阴毒、湿毒的“伏邪”,潜入机体内部,宏观
目的探讨采用国产一次性直线切割缝合器在结肠癌并肠梗阻患者施行消化道重建手术中的实用性、安全性和操作技术。方法吻合器组:47例结肠癌并肠梗阻患者消化道重建手术中应用国
文章针对棉花生产方面的现状,简述了棉花种植的发展以及利用限制性片段多态性、随机扩增多态DNA、扩增片段长度多态性、简单重复序列、数量性状位点分析等现代生物技术方法对
作者结合实际工作中对蚕丝被的检测结果,归纳出蚕丝被检测中发现的质量问题主要有:产品标识不规范,纤维含量与实际不符,填充物品质不达标,填充物含油率超标,填充物的质量偏差
在人们的社会生活以及科学研究中,图像都是不可缺少的工具。信息工程学、生物医学等学科的发展都与图像处理技术密不可分。非局部和变分正则化方法在图像处理中应用广泛,并取
<正>掩映在春秀路上的"方太生活家"体验馆周边是热闹的酒吧街。2015年上半年,方太发布的一个基于美食和生活方式的020服务社交平台,该平台包括由App、微信和线下体验馆三部分
目前我国铁路总里程突破11.2万km,有砟铁路(包含桥梁和隧道)总里程近9.6万km。针对有砟铁路的里程数和状态检测要求,探地雷达技术成为当今连续检测有砟铁路路基的主要技术手
机器视觉的研究工作很早就引起了研究人员的重视,如今相关技术已经融入了我们的日常生活。面对现实世界中的海量图像信息,机器的处理效率往往达不到需求,而人眼实际上只对图