形状的部分结构解析和识别

被引量 : 0次 | 上传用户:zhanghui1860
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大量的心理学研究表明,人眼视觉是基于部分的,许多视觉行为能够通过基于部分的表达方式进行解释。这意味着在人眼视觉系统中,形状的分解和其它视觉任务,如物体的检索、表达、识别和解析有密不可分的关系。因此,对于计算机视觉系统来说,如何将物体形状分解并得到和人的认知相一致的结果,成为涉及许多视觉任务的重要问题。但是,由于自然图像存在大量的类内和类间差异,分解成为计算机视觉领域中一个非常有挑战性的任务。最主要的挑战和困难集中在以下几个方面:1)人眼视觉涉及各种与部分相关的因素,怎样对它们的作用及其之间交互机制进行建模?2)如何得到有判别力的特征,以及怎样估计模型的结构和参数?3)在给定的模型下,如何快速得到分解结果,并使分解结果符合人的认知?本文拟将优化问题和统计模型的理论引入分解,对形状的分解和部分结构的解析进行建模、推理和学习。我们重点研究以下问题:1)如何将和部分有关的视觉因素在统一的分解框架下表达出来?2)用什么样的方式有效地表达一类物体的部分结构?3)如何从训练数据中得到部分结构模型,并提取具有判别力的特征?4)如何设计快速准确的解析方法,得到和人的认知相符合的部分结构?5)部分结构的解析和形状的识别有怎样的关系?本文的工作紧紧围绕形状的部分结构解析和识别这一核心命题展开。为回答以上问题,从以下四个方面展开研究:(1)人眼视觉处理分解的机制相当复杂,涉及曲率、对称、部分显著度、分割线长度、认知等,最终的分解结果取决于这些因素间复杂的互相影响。本文设计了一种有效地融合了各种和部分相关的视觉因素的表达方法,并在统一的分解框架下对物体进行分解。本文用求解二元规划问题的过程模拟人眼视觉中这些因素的复杂交互,以达到和人眼视觉相一致的分解结果。本文的方法不仅综合考虑了各种视觉因素,还实现了分解框架和视觉因素的分离,使得该方法在视觉因素的选择上具有很强的可扩展性。(2)由于自然界的物体千变万化,再加上二维图像的信息损失以及形状的遮挡、扭曲等非线性形变,导致物体的部分结构具有很大的可变性。现有的心理学研究成果仅能定性地解释人眼视觉分解的某些方面,而不能从根本机制上全面的描述人眼视觉是如何根据少量不完整的信息处理如此丰富的视觉模式。本文不以心理学研究成果为惟一的理论基础,而是将统计模型引入形状解析的领域。通过对训练样本的学习,确定模型的结构和参数,并选择最具判别力的特征。该模型建立在与或图上,具有层次化结构并定义了概率分布,能够表达部分的层次、空间位置、邻接关系以及部分轮廓的变化,并支持可变结构。(3)考虑到人眼视觉的分解的特点:高效性、多尺度性、不确定性,以及受到认知的影响,本文设计出一种用于部分结构解析的高效推理算法。该算法使底层信息(曲率、面积、显著度等)和中高层信息(部分轮廓的变化模式、部分的出现频率、状态变量的分布)互相补充,大大提高了分解算法的灵活性和处理能力。在推理的过程中,本文充分利用了与或图的结构,用递归的算法迭代的进行从顶向下和从底向上的遍历。最终的分解结果也具有概率形式,支持多尺度分解,并且更加准确和稳定。(4)对于人眼视觉来说,部分结构的解析和形状的识别具有紧密的联系,识别的过程可看作获取物体的各部分及其组织方式的过程。受这种思想的启发,本文提出了一种基于部分结构解析的形状识别方法。本文将分解的模型从一类物体扩展到多类,并调整了学习和推理的目标函数,以达到分类的目的。本文的识别方法不仅得到了类号,还得到了部分结构以及部分结构之间的对应关系,因此这种识别方法是符合人眼视觉系统的行为方式的。该方法结合了基于骨架和基于轮廓的形状识别方法的优点,在具有明显部分结构的物体上,取得了很好的识别效果。
其他文献
脱臭蒜素及其产品开发孙毅,魏金凤(信阳师院食品科学研究所)大蒜内含丰富的蛋白质、脂肪、碳水化合物、维生素、胡萝卜素及多种微量元素,是人们日常生活中常用的香辛蔬菜和调味佳
随着新时代社会经济的不断发展,以及我国教育事业的进一步改革,小学英语教学逐渐得到了人们的高度重视。为了更好的提高小学英语教学质量,让小学生对英语学习产生浓厚的兴趣,
本论文主要研究高效太阳能海水淡化系统,以5吨/日的低温多效海水淡化系统为研究背景,设计低温多效海水淡化系统的实验平台,重点分析板式换热器控制系统和低温多效海水淡化系
我国地方政府债务问题是当前学界、政界的一个研究热点,也是难点所在。地方政府债务有很大的风险,美国巨额债务问题的形成和危害是明显的例子。世界各国政府对债务风险进行重
相对于越来越贫乏的地表和地下水资源而言,大气水资源极为丰富且具有较大的开发利用潜力。对云进行测量建模,取得基本几何特征并建立云表面三维几何模型,可为云的气象参数科
当今社会全球化进程加快,资源开发利用加深,网络通讯普及,人员交往、文化交流和贸易日益频繁,同时由于权力过度异化、意识矛盾冲突及各种突发事件,使公共危机爆发的可能性也逐渐增
人们从外界获取的信息绝大部分来源于视觉。人们通过眼睛将获取的信息传入到大脑,再由大脑对其进行相应的处理与分析。随着传感器与计算机技术的迅速发展,计算机视觉逐渐实现
彩色图像分割是指按照某些准则把图像划分为同质、有特殊语义的不同区域。作为图像分析和图像理解的基础和关键技术,彩色图像分割一直是计算机视觉和图像处理领域研究的热点
随着智能手机在人们生活中的广泛应用,一些过去人们不敢想的梦想变成现实。科技的发展无疑是“中国梦”的重要动力,而智能手机在科技发展中无疑也扮演着重要的角色。在过去短
聚丙烯酸酯类聚合物因具有成膜性好、粘结性强、耐热、耐氧化等优点而被广泛应用于涂料印花粘合剂,但其存在胶膜硬度大、耐水性差、“冷脆热黏”以及印花织物手感与牢度难调和