基于点云和立体视觉的三维目标检测算法

来源 :天津大学 | 被引量 : 0次 | 上传用户:tianzhihen1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
三维目标检测是场景理解任务中的基础问题之一,在智能驾驶和机器人感知等领域有着广泛的应用前景。基于不同传感器数据的三维目标检测算法在性能、效率以及应用场景等多个方面均存在差异。能获取精确距离的激光雷达和具有较高分辨率的双目相机常作为主要的感知设备应用于智能驾驶系统。激光雷达通过发射特定波长的激光束并接收目标回波以获取场景的三维点云。当前基于点云的三维目标检测算法存在两个问题。一是在点云的特征提取网络中,语义信息(例如逐点的类别标签)没有被充分利用;二是在鸟瞰视角下,三维目标对应的特征尺度变化幅度较小,但当前的方法采用了过多尺度的特征,这导致感受野与目标的物理尺寸不匹配的问题。针对以上两个问题,本文提出了基于点云互补特征与合理感受野的三维目标检测网络。其中包含语义和位置分支的互补特征提取器可以充分提取点云的潜在语义信息和准确的几何位置信息,形成的互补特征可以增强对远距离和被遮挡目标的表达能力。本文还分析了道路场景下三维目标检测网络的感受野适配问题,并通过实验论证了合理的感受野可以使模型在更少的参数量和计算量的情况下获得性能提升的结论。双目相机可以通过对左右视角图像中的像素匹配而获取致密的三维场景深度信息。但受图像分辨率和计算量等因素的制约,其距离精度与激光雷达相比还有很大提升空间。为了解决基于双目立体视觉的三维目标检测算法中远距离深度估计不准确的问题,本文提出了深度渐进编码方法,在同等算力条件下对远近深度平面进行动态调整,使远距离目标在左右视图中能被更精准地匹配,并获得更准确的深度估计值。本文还发现双目深度估计中目标与背景的纹理及语义等特征不一致,同等对待目标与背景所产生的深度估计损失会导致模型忽略占比较低的目标损失。针对这个问题,本文提出了聚焦目标的深度估计损失函数,通过平衡目标与背景损失比例以使模型预测更精准的目标深度,进而得到更准确的三维目标检测结果。
其他文献
为了提升高职院校的人才培养质量和效率,高职院校纷纷进行学生管理策略的全面优化与革新。在高职院校的学生管理过程中,进行“三全育人”理念的运用是很有必要的。通过分析“三全育人”理念的具体内涵以及“三全育人”理念的具体方向,或可对当前高职院校在学生管理过程中存在的问题进行深入分析和探究,采取可行的策略,完善高职院校的学生管理工作,让高职院校的学生管理工作质量达到更理想的状态。
期刊
报纸
当前,随着5G移动网络技术和视觉分析技术的迅速发展,信息获取方式产生了深刻变革,短视频在这样的背景下蓬勃发展,逐渐取代了以文字图片信息为主的信息传播模式。短视频作为多媒体数据具有多模态特性和丰富的语义信息,这些信息由于具有不同模态和维度的特征而具有高阶属性,也伴随着噪声和相关性信息,这给训练模型过程带来了挑战。短视频事件检测任务涉及到多模态信息的交互,充分发掘这种模态相关性并进行多模态融合是事件检
学位
微动作检测也被称为时序动作检测,是视频处理的重要环节。基于深度学习的时序动作检测与识别技术在精度和速度等方面远远超过了传统算法。但是,目前时序动作检测还存在精度低、难以区分动作边界等问题。针对以上问题,本文基于深度学习和卷积神经网络,对已有的编码-解码时序动作检测算法进行了深入的研究,并做出以下三个方面的改进:(1)将原算法中的特征提取网络替换为具有残差结构的深度卷积网络,使整体网络可以提取到更丰
学位
随着电动汽车充电需求的增多,电动汽车用户与多家充电运营商、公用供电企业之间出现了支付复杂、信息不联通的情况。电动出租车所需的充电次数较多,也缺乏能够包含多个充电运营商的充电引导服务,因此本文寻求一种新的充电服务机制以解决上述问题。为了实现充电服务的互联与充电交易的自主管理,本文提出了基于联盟链的电动汽车充电服务机制。该机制采用联盟链构建充电服务模型,通过实用拜占庭容错共识算法验证电动汽车充电交易,
学位
报纸
报纸
近年来,三维模型分类和检索任务已成为多媒体领域和计算机视觉领域中的一项研究热点。随着深度学习技术的蓬勃发展,各种高性能的深度学习模型被提出并广泛使用。这些深度学习模型关注于不同的三维模型表示形式,例如点云、多视图、全景视图等等,均表现出了卓越的性能。但是,这些方法都忽略了一个重要的信息,即相同的三维模型在不同的模态表示场景下的多模态信息。本文提出了一种创新性的多模态融合网络来解决三维模型数据的分类
学位
报纸
报纸