【摘 要】
:
根据单张图像估计深度信息是计算机视觉领域的经典问题,也是一项具有挑战的难题。在传统的计算机视觉中,由于单目图像的尺度不确定性,导致根据单目图像无法计算深度值,仅能通过双目图像计算出稀疏深度值。目前,基于深度学习技术的单目深度估计方法成为了研究热点。基于监督学习的单目深度估计方法通常需要依赖大量的真实深度标签用于模型训练,然而获取真实深度的成本是非常高昂的。基于无监督学习的单目深度估计通常根据双目图
论文部分内容阅读
根据单张图像估计深度信息是计算机视觉领域的经典问题,也是一项具有挑战的难题。在传统的计算机视觉中,由于单目图像的尺度不确定性,导致根据单目图像无法计算深度值,仅能通过双目图像计算出稀疏深度值。目前,基于深度学习技术的单目深度估计方法成为了研究热点。基于监督学习的单目深度估计方法通常需要依赖大量的真实深度标签用于模型训练,然而获取真实深度的成本是非常高昂的。基于无监督学习的单目深度估计通常根据双目图像之间的图像重建损失监督网络模型训练,不需要依赖深度真值。针对基于监督学习的单目深度估计方法需要依赖真实深度值的问题,本文研究了基于无监督学习的单目深度估计方法,主要工作如下:首先,针对单目图像中无效特征影响模型优化和反卷积导致的棋盘效应,提出了基于SR-BINet编码器-解码器网络的无监督单目深度估计方法。首先,SR-BINet网络的编码器对每层特征增加了可学习的权重,在网络训练时增大有效特征映射的权重,减小无效或者效果小的特征映射的权重。因此,SR-BINet网络的编码器能够更加高效地提取有效特征,同时去除图像中无效特征的干扰,使得网络模型更易收敛。其次,SR-BINet网络的解码器通过先进行双线性插值再进行卷积的方式,预测出与输入图像同分辨率的视差值,能够消除反卷积带来的棋盘效应的影响。其次,针对无监督单目深度估计中双目图像重建过程存在的遮挡问题,提出了自适应左右一致性约束,用于降低遮挡区域对模型优化的影响。在双目图像重建过程中,遮挡区域和非共有区域的图像重建误差较大,而共有区域的重建误差较小,在计算左右一致性损失时需要区分这两种区域。因此,本文提出了自适应左右一致性约束,能够平衡遮挡和非遮挡区域的误差分布。通过使用L2范数计算图像重建的全局平均误差,并设计了 一种单像素误差相对全局平均误差的权重计算方式。该权重的计算和图像重建误差相关联,能够根据误差的大小自适应计算权重,平衡了两种误差的分布,从而降低了遮挡区域对模型优化的影响。最后,本文在KITTI数据集上进行实验,详细地描述了实验环境、参数设置和实验结果,并和其他单目深度估计方法进行对比,实验结果证明了本文提出的两种无监督单目深度估计方法能够提高单目深度估计的准确率。
其他文献
随着科学与经济的发展以及“工业4.0”概念的提出,制造业开始纷纷向着“智能化、智慧化”的方向发展。基于AGV的“货到人”拣选系统是当前物流行业的主流选择,该系统中以自动导引小车(Automated Guided Vehicle,AGV)为搬运工具。本文所研究的多仓位机器人存取系统(Muti-position Robotic Storage and Retrieval System,MP-RSRS)
戒毒所作为一个人员聚集的场所,需要更加方便快捷的监管方式,从而提高监管人员的监管效率。同时,消防安全知识和消防技能是如今社会每个公民都必备的一项重要内容,因此,除了常规的监管操作,戒毒所也需要监管消防安全问题。随着虚拟现实技术的发展,其拥有的沉浸感较强、不受实际场地限制、可多次重复的特点,受到了人们的广泛欢迎,进而应用于各行各业。使用虚拟现实技术对戒毒所进行监管和消防演练比起传统方式具有成本低、可
复杂网络的链路预测一直是复杂网络领域一个非常重要的研究方向。链路预测既有着对未知但已存在的边的预测,也有着对未来的可能存在的边的预测。将复杂网络从静态网络扩展到动态网络可以有效区分未知和未来的边预测,而链路的权重预测也将链路预测的链路存在有无扩展到链路的正负以及可能形成的链路的值。在交易系统中,尤其是像使用比特币进行交易的这样匿名性强,欺诈风险较大的交易系统中,提前对交易对方的可靠性有一个大致的估
树覆盖问题是一个基本的组合优化问题,在电话机房、网络机房及发电厂等规划方面有着重大的研究价值。树覆盖问题主要包括四类,包括最小最大树覆盖问题、有根的最小最大树覆盖问题、有界树覆盖问题和有根的有界树覆盖问题。对树覆盖问题的研究,不只是对问题本身关联的实际有促进作用,对其他相似的问题而言也有重要的研究价值,例如圈覆盖问题、车辆寻路问题、路径覆盖问题和集合覆盖问题等。本文中主要研究的树覆盖问题是最小最大
基于人体骨架序列的动作识别是人工智能应用范畴中一个热门且非常具备应用性的研究问题。目前,该问题在视频监管、体感游戏、病人监护、无人安防、人机互动、机器作业等领域有着大量的应用。随着人体骨架数据获取设备及动作捕获传感器的发展,传感器可以有效地获得动态人体骨架序列。因此,迫切须要设计一个能够充分且合理利用人体骨架序列的动作识别算法。人体骨架序列充分表示了人体信息的时空特征表示,但初始的人体骨架序列往往
在如核电运行维护、大飞机生产制造等工业领域中,存在大量操作流程复杂、工作强度大、灵活性要求高、难以实现机械化与自动化的工作任务,执行这些任务只能依靠人为操作。在作业执行过程中,作业人员的工作效率与人身安全难以保证。因此,能够与人协同运动,实现部分作业任务自动化的外肢体辅助机器人成为解决上述问题的新型技术手段。外肢体辅助机器人是一个多工况、多任务空间的高维系统,针对该系统的多任务运动规划与控制方法是
当今时代,随着计算机软件技术的飞速发展,人们越来越依赖于各种计算机软件来方便的处理事务,各种各样的软件也是不断地推陈出新。在软件开发过程中,开发人员经常会重复使用大量第三方库函数。对于逆向分析工作来说,准确地识别在软件中复用的库函数具有重要意义,例如检测已知漏洞、对恶意软件进行反向分析等。如果能够使用自动化的方法有效标记出各种复用的库函数,就可以显著提高软件逆向分析的效率,减轻逆向分析人员负担,并
当今社会,随着互联网的迅速发展,来自互联网、工业生产、企业内部的数据成为了一项重要资产,迸发出巨大的商业价值,而企业需要掌控这些数据来赢得机遇、抢占商机。因此,它们迫切需要运用大数据分析技术挖掘其背后的规律并加以利用,从而为企业提供更有价值的信息,以便在市场竞争中夺得先机。同时,企业对数据分析应用的多样性需求,为数据分析平台的快速开发、重构与即时运维技术带来了巨大挑战,需要针对不同数据分析的应用层
基于卷积神经网络(CNNs)的多任务学习方法在计算机视觉的各种应用中取得了显著的成功,是目前重点关注的研究方向之一。多任务卷积神经网络是在单任务模型结构保持不变的情况下,学习多个任务的共享表示,该共享表示适用于不同但相关任务的训练目标,使多任务模型更具有泛化能力。随之各任务分支拟合各自输出,从而完成多个任务的联合预测,并取得整体性能的提升。对于有效的多任务卷积神经网络方法,最近的研究均是通过自动学
为满足空间大轨道转移任务要求,基于电推进系统液氪低温推进剂在轨长期贮存的应用需求,从低温推进剂贮箱壳体材料、贮箱热防护技术、微重力环境下贮箱内气液分离和流体管理等四方面入手,聚焦于国内外相关研究进展,总结了关键技术的发展现状,结合氪工质贮存要求进行了分析,旨在为电推进系统液氪贮箱设计提供参考。