单目相机图像深度和位姿估计的研究与应用

来源 :武汉工程大学 | 被引量 : 0次 | 上传用户:lk1892
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
推理场景的立体结构是计算机视觉中常见的任务,其基本目的是根据传感器获取的平面信息推理出场景的立体结构。已有很多基于双目相机或距离传感器的研究用于解决这类问题。基于单目相机的方法由于只能利用一些局部的二维信息,在推理场景的立体结构时会遇到更多的挑战。但这类方法更少地依赖传感器,能利用有限的信息解决问题,所以非常具有研究价值。我们需要解决的两大问题是把二维信息变成局部立体信息并推理这些局部立体信息的关系。前者称为深度估计,后者称为位姿估计。本文针对基于特征点的深度和位姿估计问题中的Pn P(Perspective-n-Point)问题提出了一个更优的算法,并结合SLAM(Simultaneous Localization and Mapping)设计实验验证该算法在常用数据集和真实场景中的效果。为了降低位姿的累积误差,设计了一个关键帧选取策略,用于保证关键帧的质量并限制关键帧的数量;针对离群点影响实验精确度的问题,设计了一个匹配点筛选策略,用于剔除离群点。在数据集和真实场景中的实验表明,本文提出的算法能有效地降低误差。针对基于无监督深度学习的单目深度和位姿估计算法,本文提出了基于三维点云的立体优化算法,用于优化估计出的深度和位姿。在估计位姿和重建深度图的过程中,不但让生成的深度图保持局部平滑性并与原始图像保持结构相似性,还利用估计出的位姿让空间点(点云)尽可能地相互重合。该算法使用点云配准的迭代算法让这些空间点对齐,并在多次迭代中丢掉离群点,以获得更加精确的效果。对比实验的数据表明我们提出的算法可以提高准确度。为了提高深度估计的准确度,根据深度图与语义分割图的内在联系性,本文设计了一个多任务卷积神经网络。该网络结构分为编码器和解码器两部分。编码器通过多次卷积,从图像中提取丰富的特征,这些特征被输入深度估计解码器和语义分割解码器用于深度图和语义分割图的重建。为了让两个解码器产生联系,在两个解码器中设计了一个信息共享策略,使深度图和语义分割图保持内在的一致性。实验结果表明我们的网络模型生成的深度值准确性更好。
其他文献
《普通高中化学课程标准(2017版)》凝练了化学学科核心素养,明确了学生在学习过程中应达到的必备品格、关键能力和正确的价值观。同时教学内容呈现了科学,技术、社会、生态环境等多方面的新成果,培养学生的社会责任感、创新精神等,提升学生的学科核心素养。STSE是科学(Science)、技术(Technology)、社会(Society)、环境(Environment)四个单词的首字母组合。STSE教育理
学位
生命起源于合作,合作是自然界和人类社会得以演进的重要基础。但是公地悲剧、搭便车等公共资源过度使用现象的存在,表明了在自私个体组成的种群中达成合作的困难性。演化博弈
人脸识别具有交互性强、无需接触、便捷等优势,是模式识别领域研究的热点问题,在公共安防、智能教育、行人检测等领域得到广泛应用。但实际场景中,由于监控硬件设备受限,目标行人常常距离摄像设备较远,所采集的人脸图像分辨率较低,难以达到准确辨识的要求。因此,对实际场景中的低分辨率人脸图像进行识别是提升人脸识别系统性能的关键。随着人工智能的兴起,基于深度学习的识别方法已经成为人脸识别领域的主流算法。由于人脸为
近年来,致密砂砾岩油气藏的勘探是准噶尔盆地勘探开发的重中之重。玛湖砂砾岩储层具有岩石成分复杂、粒级变化大、孔隙结构复杂多变、低孔低渗、流体粘度变化大等特点,使得传
偏微分方程在数学、物理学、力学和工程技术等方面都有着广泛的应用。根据数学特征,偏微分方程主要分为三大类:椭圆型方程、抛物型方程和双曲型方程。在椭圆型和抛物型偏微分
随着近年来全球气候持续变暖,环境危机和能源消耗成为目前人类面临的一大难题。车身的轻量化有利于环保,而铝合金材料可以大大减轻车身结构件的重量,实现降低能源消耗、减少
镁合金具有密度小、比强度高、电磁屏蔽性能好等优点,在需求轻量化的汽车、航空、3C等领域都有广阔的应用前景。但密排六方晶体结构导致镁合金的常温塑性及成形性能较差,而且
随着经济与文化的发展,社会对人才的定义提出了新的要求。目前我国教育事业的重要内容与核心之一就是“立德树人”,要求我们建构适合于我国中学生自身发展的核心素养,并且要培养中学生适应其个人发展与社会要求的品质与能力。因此,将核心素养的培养作为高中化学教学的重要内容是必然的。而其中“变化观念与平衡思想”本身就是化学核心素养的重要构成之一,因此对于教师来说,设计基于“变化观念与平衡思想”的教学设计并将其应用
学位
基于相位敏感光时域反射计(Φ-OTDR)的分布式光纤振动传感系统具有损耗低、灵敏度高、可探测距离远、抗干扰能力强和能同时进行多点定位等众多优点,被广泛应用于周界安防、石油管道检测和铁路沿线监测等领域。由于实际应用环境的复杂性,系统的漏报率和误报率高一直是亟待解决的问题。本论文采用图像处理的方法,围绕Φ-OTDR系统的信噪比的提升和振动模式识别问题展开理论和实验研究,完成的主要内容如下:(1)对Φ-
液化天然气(LNG)运输,储存等过程中,由于储罐和管道达不到绝对的隔热,不可避免的会产生蒸发气(BOG)。BOG的存在会造成储罐压力升高,对储罐结构造成破坏,存在较大的安全隐患,