基于深度学习的立体匹配算法研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:qb54223322
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
双目立体视觉是被动式三维视觉方法中一种重要的深度感知技术,其目的是从不同视点获取的两幅图像中恢复出场景的三维结构,广泛应用于工业测量、无人驾驶、3D场景建模等领域。其中,立体匹配算法的准确性和计算效率是决定立体视觉系统能否鲁棒、实时应用的关键。与人工设计特征的传统立体匹配方法相比,基于深度学习的立体匹配算法在精度上取得了显著提升,但在弱纹理、倾斜平面以及深度不连续等病态区域上仍然不理想,且随着网络结构的日益复杂,对内存和计算资源的要求越来越高,在实际应用中往往难以部署。为了实现计算资源受限情况下的高精度立体匹配,本文基于经典的DispNet网络进行改进,提出了两种端对端的视差计算网络,通过实验验证了网络的准确性与鲁棒性。论文的主要研究内容如下:(1)研究了双目立体匹配基础理论以及卷积神经网络的基本构成。由于立体匹配和图像分割任务同属于逐像素的稠密预测任务,为了更好地将深度学习方法应用于立体匹配问题,研究了三个经典的图像分割模型,并重点研究了基准模型DispNet的网络结构和实现原理。(2)提出了一种基于长短跳跃连接的视差计算网络,简称为Res-DispnetC。该网络使用编码-解码结构,通过引入残差结构和基于矩阵乘法的代价计算方法实现网络结构调整与性能优化。在SceneFlow和KITTI数据集上的实验结果表明,该方法可以快速准确地生成高分辨率预测视差图,便于在实际场景中应用部署。(3)提出了一种基于混合注意力机制的视差计算方法,简称为Res-DispnetC-scSE。通过将并行的空间和通道挤压激励模块scSE嵌入到视差估计网络中进行端对端训练,可以自适应地增强匹配代价体中重要的空间与通道信息,提高网络的学习能力。通过在SceneFlow、KITTI和Middlebury数据集上进行实验验证,结果表明,嵌入scSE模块的视差计算网络在真实的室内外场景中都可以实现稠密的高精度视差预测,具有良好的泛化能力,且明显提升了弱纹理、细小结构等病态区域的预测精度,充分证明了本文模型的鲁棒性与有效性。
其他文献
人工智能的立法挑战兼具“功利”与“道义”双重属性,这要求立法超越近代以来的“科技—经济”立法范式,而转型至“在功利与道义之间”,并以此引领和保障人工智能立法的科学性。其中,道义论约束设定了基本门槛,人工智能活动只有在经过道义论检验之后才能转向功利性考量,否则就将是否定性评价。具体而言,立法必须注重人工智能在“安全问题”、“权利问题”以及“人性问题”三领域构成的道义论挑战,并以此为基础在人工智能的研
议论文是高考写作的常用文体,十分考验学生的素材储备和辩证思维。高中语文教材中的课文正是学生模仿的佳例,教师完全可以在日常阅读教学中以此为例指导学生的议论文写作。《师说》是一篇典型的正反对比式议论文,学生在学习课文的字词句及其精神内涵之余,还应认真研究篇章结构,归纳出正反对比式议论文的写作方法,以便在日后的写作中加以运用。
分布式多智能体系统是依赖于智能节点之间的相互通信、协调合作而组成复杂网络系统,它在智能交通、智慧城市、集群编队、传感器网络等多种领域内均发挥着重要的作用。一致性作为分布式多智能体系统控制的基本问题在过去的十年中得到了广泛而深入的研究。现有的一致性问题研究中,大多数假设了网络通信可靠运行、智能体始终保持稳定、拓扑结构固定等。在实际的多智能体系统分布式控制中必然会面临网络通信不稳定、智能节点受恶意攻击
由于通信技术的飞速发展和通信设备的日益复杂,电磁环境中出现了多种多样调制方式的通信信号。作为无线电频谱监测、认知无线电、软件无线电中的关键工作环节,通信信号调制方式识别是在缺乏先验信息和存在噪声干扰的情况下,分析接收信号样本获得其调制方式和其它调制参数的技术。正交频分复用(Orthogonal Frequency Division Multiplexing,OFDM)是一种新型的多载波调制技术,被
现实世界中,多目标优化问题无处不在。目标数为2和3时,我们称为多目标优化问题,当目标数大于3时,我们称之为超多目标优化问题。经过这些年的不断探索,多目标优化算法在理论层面以及实际应用中都取得了不错的进展,但对于超多目标优化问题来讲,很难获得较好的Pareto前沿。因此,如何保证种群解集的收敛性和多样性成为提升算法性能的关键。头脑风暴优化算法是基于群体迭代搜索的一种智能优化算法,具有模型简单、收敛迅
在企业内部层面提升上海民营企业的创新能力,要培育创新型企业家精神,积极引导企业技术创新、产品创新、管理创新、制度创新、观念创新,为企业创新发展奠定基础。要推动创新人才队伍建设,培育、引进科技型创新人才,采取积极措施激发其创新精神,推动企业创新发展。要加强产品的研发力度,整合各种资源,突破关键核心技术,通过自主技术创新实现产品创新,提升企业在全球价值链中的地位。
近年来,无监督域自适应(Unsupervised Domain Adaptation,UDA)算法成为了深度迁移学习算法的研究热点,该算法要求仅源域数据有标签,目标域数据无标签。目前,大多数UDA算法都是针对单源无监督域自适应展开研究,然而在实际场景中,源域数据往往是通过各种来源获得的,不同来源获得的源域数据与目标域数据在特征分布上相似但相似程度有所不同,而且不同来源得到的源域数据在数据分布上也会
气动位置伺服系统采用空气作为介质,其结构简单、安全可靠、反应迅速等突出优点使它得到广泛关注,从汽车、地铁的开关门到人工呼吸器再到气动机器人,气动位置伺服系统在自动化各行业有着举足轻重的地位。由于气体存在可压缩,性的特点且气动位置伺服系统受到非线性的阀口流动及气缸存在摩擦力等因素的影响,给创建气动伺服系统的精确模型带来了重重困难,这给依靠模型的传统控制方法设计带来了困难。同时,气动系统时变的工作点和
符号回归作为一种数据驱动建模的重要方法,能够在很好的拟合训练数据的同时,给出显性的数学表达式便于分析。在数据驱动建模中,一味追求高拟合精度往往会造成模型的过拟合,通常表现为模型复杂度增大,对未知样本的预测能力降低,即模型的泛化性能差。因此,平衡模型精度与泛化能力的研究就很有意义。奥卡姆剃刀法则说明,越简单的模型越有可能接近数据隐含的规律。基于此,本文针对现有符号回归方法只关注模型的拟合能力而忽略模
图作为一种较复杂的数据结构类型能够表示众多含有丰富信息的特征结构,其可以被用来刻画各种复杂数据特征以及结构特征之间的作用关系。目前,图结构数据在社交网络、电子购物、化学分子以及交通网络等领域有着非常广泛的应用场景。对于图结构数据的分类任务是,根据图数据节点或结构特征,在无监督下学习一组标记图形结构特征之间的关系将图结构数据进行多分类,并且能够正确地预测看不见的图形标签或结构。由于图结构数据既含有节