智能驾驶多模态感知方法研究

来源 :清华大学 | 被引量 : 0次 | 上传用户:ren198525
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
智能驾驶关键技术主要包括感知、认知和控制三个部分。环境感知作为其第一个环节,是认知和控制的基础。它使用车载传感器对本车及周边环境信息进行采集和处理,得到驾驶环境中各目标语义和位置信息,并将此信息提供给驾驶认知环节。视觉相机和激光雷达作为环境感知中最为重要的两种车载传感器,主要存在如下问题:视觉相机分辨率较高但其距离检测精度较低,激光雷达测距精度高但点云稀疏,无法描述细节特征,使用单一模态传感器均存在信息不全面的问题;视觉相机和激光雷达的采样频率不同,安装位置和数据形式也存在较大差异,导致二者在融合过程中时空无法精确配准,也难以使用通用方法处理不同模态数据。针对以上问题,围绕多模态融合感知方法,本文的主要研究内容和贡献如下:1)为解决多源异构传感器时空同步问题,提出了一种视觉相机和激光雷达联合自动标定的方法。在空间标定上,通过对标定板位置的多次识别,自动计算各传感器之间的转移矩阵,并采用重投影法和最大似然估计降低空间标定误差;在时间标定上,使用多线程法实现不同采样频率传感器的时间配准。2)提出了一种基于多模态特征的目标分类方法。该方法将激光雷达点云稠密化为两种伪相机数据(深度特征图和深度、高度、角度特征图),再与视觉相机的颜色特征数据融合,采用六通道卷积神经网络进行特征学习和分类。实验表明,与仅使用图像颜色特征相比,使用RGB-LIDAR联合特征的目标分类准确率能够提高5%,而使用RGBDHA联合特征的准确率能够提高15%。3)针对复杂室外条件下智能驾驶汽车目标识别问题,提出了一种分级多视图候选神经网络模型。该模型将深度学习与传统启发式方法相结合,是一种端到端的目标识别模型。它存在多个分级网络,RGB图像作为主网络的输入用于目标识别;而雷达数据以四个投影视图和原始3D点云的形式作为从网络的输入,为目标识别生成位置候选区域。实验表明,该方法比现有方法在目标候选区域识别的召回率上高出20%以上,在目标识别平均准确率上高出10%。4)受驾驶认知的启发,提出了一种基于残差注意长短期记忆网络的目标跟踪方法。该方法将选择性注意和选择性记忆融入环境感知中,使用基于规则的学习以及相似性得分和相似性得分变化作为学习依据,稳健地构建了时空关注模型和注意力选择机制。实验表明,该方法与现有的深度跟踪器相比,在保证目标跟踪成功率的基础上,跟踪速度提升了6倍。
其他文献
三江源地区位于地球“第三极”,号称“江河之源”、“中华水塔”,水源涵养和生态保护的地位举足轻重。受气候变化和人类活动的影响,三江源地区的水文形势和植被生态正在经历显著的变化。本论文论文针对三江源地区的植被演变开展研究工作,定量解析了气候变化和放牧活动的影响,探究植被活动对水热条件和放牧活动的响应关系。探究气候变化和人类活动对该敏感区生态系统的影响规律,具有重要的科学意义,对三江源地区土地资源利用有
本文结合辽宁省大伙房水库输水工程运行管理,分析了大口径长距离输水管道建成后运行维护工作中存在问题,并提出了相应的措施,为今后类似工程建设和管理提供经验。
现有的天然气供热方式以直接燃烧为主,为了提高天然气在建筑供热时的利用效率,并兼顾提高供冷效率,本文针对现有燃气机热泵的优势与不足,提出了燃气发动机与电动机共同作为动力源的混合动力热泵系统,并从混合动力热泵系统构建、样机开发与性能实验、仿真模型与性能模拟、设计方法、运行控制策略和系统适应性等方面开展了如下工作:(1)整合燃气机热泵供热与电热泵供冷的优势,提出了混合动力驱动的新型热泵系统,包括冬夏季分
共价有机框架材料(COFs)历经十余年的发展,在材料设计,合成策略,性能研究方面都取得了很大的进步,然而COFs的结构研究落后于其在合成和性能等方面的发展。一方面受制于COFs单晶培养的难度,导致其结构解析比较困难,另一方面,对于主流的二维(2D)COFs,其层堆积方式主要为层间互相重合的AA堆积,其它堆积方式较少,缺乏具体的合成策略来实现二维COFs层堆积的可控合成。鉴于层堆积方式深刻影响其物理
光学相干层析成像(OCT)作为一种近红外层析成像技术由于其在空间分辨率、灵敏度、造价及系统集成上的优势目前已商用于眼底、胃肠道、心血管及皮肤等疾病的诊断中。对疾病的诊断是基于OCT对生物组织结构形貌的成像。除了可以对组织结构成像,基于相位分辨的OCT测量方法可以获得亚纳米量级的位移分辨率,因此OCT也被用于获取生物组织位移、流速及振动等功能信息。本论文发展了基于相位分辨OCT的多模态系统用于解决在
在环境中寻找食物、社交对象、栖息地以及避开危险对动物的生存至关重要。在复杂环境快速运动过程中,动物不仅需要高度的觉醒维持专注的状态,还需要空间记忆来更新对环境变化的认知。但是目前为止协同调控这些过程的神经环路还不太清楚。之前的研究显示位于脑干脑桥的未定核可能参与调控这些过程,尽管具体细胞类型的神经环路机制还尚不清楚。在本论文中,我们希望探究以下几个问题:(1)未定核的神经元活性是否与运动速度、觉醒
剪力墙是高层建筑的主要抗侧力构件,强震时可能出现受拉状态。为保证高层建筑抗震性能,严格控制剪力墙轴拉力水平已成为超高层建筑设计审查的要点之一。本文研究RC剪力墙拉-剪和拉-弯受力性能及设计方法。主要创新工作和成果如下:(1)完成了7个RC矮墙(剪跨比λ=1.1)在恒定轴拉力和往复水平剪切荷载下的拟静力试验。研究了轴拉力、边缘配筋率对矮墙抗震性能的影响。试验表明:不同轴拉力和配筋率下剪力墙出现剪切破
学位
由于回音壁模式光学微腔品质因子高、模式体积小,可以极大地增强光与物质的相互作用,已经成为研究腔光力学系统的重要平台。目前回音壁腔光力系统已经广泛应用在光信息处理、基态冷却和高灵敏度探测等领域。不同于单个光学模式与单一力学模式的耦合,多模耦合光力系统可以提供更多可操控的自由度,探究不同路径的干涉效应,因此展现了丰富的物理现象,例如光力系统纠缠、奇异点等。本论文围绕回音壁微腔中的多模耦合光力系统的性质
不断加快的城市化进程和蓬勃发展的工业生产,也给我们带来了日益频繁的突发水污染。水污染事件发生后,其首要任务便是快速确定污染源以还原污染事件、预测污染物蔓延扩散情况。本文以突发水污染溯源为主要研究目标,利用伴随、同化等方法构建了求解边界入流、污染源项、支流入流和参数识别的反问题数值模型,系统性地对河渠突发水污染溯源相关反问题展开了深入研究。论文主要成果如下:(1)基于旋转x-t平面提出了水流水质反演