论文部分内容阅读
草图从远古时期就作为描述客观世界的一种有效方式,随着当今移动触摸屏设备的快速普及,人的手画物体草图识别研究逐步引起了极大的关注。分类和识别人的手画草图是解决计算机视觉领域的许多重要应用问题的基础,如基于草图的图像检索以及人机交互等。另外,物体识别是计算机视觉的一个基本问题,物体位置预测(object proposals)被看作是物体识别的一个关键步骤,能极大的提高物体检测与识别的效率。本文围绕以上相关关键问题进行研究,具体包括草图自动生成及其在基于草图的图像检索技术中的应用,草图物体识别,以及物体位置预测。本文提出了一种感知编组算法用于高效解决草图的自动生成问题,这一问题旨在将真实图像转换为类似于人的手画草图的形式。具体来讲,本文研究了如何将多种格式塔规则融合到统一的感知编组框架下,用于草图的自动生成。进一步的,本文提出一种解决格式塔规则的竞争现象的方法,引入了格式塔规则相对重要性的概念,用来优化草图自动生成算法。并且提出了一个有人工标注的包含96个类别共7680张草图的数据集,用来学习格式塔规则的相对重要性。另外,本文提出了一种新的评价自动生成的草图质量的方法,即以用真实草图训练得到的分类器是否能较好的分类自动生成草图作为评价其质量的度量标准。随后,所提出的一种新的基于草图的图像检索算法进一步验证了草图生成算法的实用性和有效性。对于草图物体识别这一重要问题,和处理物体识别任务一样,大部分前人的工作都遵循标准的有监督的学习算法来训练分类器从而识别草图物体的类别。其中最重要的问题之一就是如何有效的提取草图特征,即草图的特征表达问题。本文提出了一种基于块的稀疏表达算法来作为描述草图的特征,这是首次将稀疏编码应用于草图物体识别。在一个大规模草图数据集下的草图物体识别实验结果验证了所提特征表达方法的有效性。然而,几乎所有草图物体识别算法都假定有足够的训练数据可用,因此这些算法对于训练数据敏感度较高,并且不能对新类别草图物体的识别有所帮助。为了解决这一局限性,本文提出了一种迁移学习算法,能够只用一张草图作为训练数据来分类对应类别的草图物体。具体的,本文提出了一种基于互约束的稀疏表达算法,可以从已知的草图类别数据中挖掘通用或可替代的草图物体部件,并将这些通用部件信息迁移到新类别草图分类器的学习中。实验结果表明本文所提算法大幅提高了其他算法在相同训练数据下的草图物体识别准确率。最后,本文优化了前面提出的感知编组算法,用于将图像边缘组织成有意义的结构,并证明了这种边缘编组结构在物体位置预测问题上的有用性。所提出的感知编组算法将边缘编组问题模型化为一个图分割问题,并采用学习并排序(learning to rank)的策略来预测任意边缘对被编为一组的概率。随后,基于感知边缘编组算法,本文又提出了一种新的物体位置预测算法,并与目前最好的一系列算法的比较结果证明了所提算法的有效性。