基于深度学习的RGB-D场景语义分割算法研究

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:kernel_gdi_user
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语义分割任务的目的是根据输入图像的内容识别出图像中像素点的语义类别。作为智能场景理解的基础,语义分割具有重要的研究意义,现在被广泛应用于自动驾驶和机器人感知等领域。然而,由于现实环境复杂的光照变化和物体间的遮挡,语义分割仍然是一个具有挑战性的问题,仅靠单模态RGB信息难以对复杂场景进行精确分割。近年来,随着深度传感器的出现,人们开始对含有深度信息的RGB-Depth(RGB-D)图像展开研究。RGB图像能够描述物体颜色和纹理之类的外观信息,深度图像能够描述物体的空间几何信息。因此,可以将深度特征作为颜色特征的补充,提高语义分割精度。然而,现有解决方案仍然未能充分利用RGB特征和深度特征之间的互补信息。为了探索更有效的多模态特征融合方法,提升复杂场景的语义分割精度,本文主要进行了以下的研究工作:首先,本文对图像语义分割的研究现状和相关技术进行了概述。具体来说,本文对现有的单模态RGB图像和多模态RGB-D图像语义分割算法的优劣进行了分析,明确现有基于多模态特征融合的RGB-D语义分割方法存在的问题和挑战。同时,本文对卷积神经网络和注意力机制有关方法进行了详细介绍。其次,本文提出一种基于多模态自适应卷积的RGB-D图像语义分割算法。在现有卷积神经网络中,卷积核参数在训练之后通常是固定的,无法根据输入图像的内容自适应调节。本文提出一种多模态自适应卷积操作,将多模态特征的上下文信息嵌入多尺度卷积滤波器中,多模态RGB-D特征通过自适应卷积协同交互,其卷积核参数根据输入的多模态图像动态调整,在卷积运算过程中有效利用多模态特征的上下文信息。自适应卷积核相比传统卷积核更加灵活,可以自适应捕获RGB图像和深度图像的内部变化,有效提升最终的分割精度。最后,为了充分利用RGB特征和深度特征之间的空间互补信息和语义相关信息,提出一种基于注意力感知和语义感知的多模态RGB-D语义分割模型。通过引入注意力感知多模态融合模块和语义感知多模态融合模块,有效地提取并融合多层次的RGB特征和深度特征。其中,注意力感知多模态融合模块设计了一种跨模态注意力机制,RGB特征和深度特征利用互补信息相互指导和优化,提取富含空间位置信息的特征。语义感知多模态融合模块整合语义相关的多模态特征通道,建模多模态特征之间的语义依赖关系,提取更精确的语义特征表示。本文算法有效提升了语义分割的边界精细度和像素分类准确率。
其他文献
随着我国逐步开始全民医保的建设,城乡居民大病保险(简称大病保险)建立在基本医疗保险的基础上,目的是为了减轻部分家庭因为患大病而产生高额医疗费用支付压力。在2017年,L市全面实施大病保险政策,经历了由初始建立到不断完善的过程,本文以L市为例,从城乡居民角度出发,以问卷调查的数据和实地调研的信息为依据,以价值维度和事实维度,通过前后对比的方法和问卷调查的方式对政策绩效进行宏观分析和实证分析,最后进行
中国和美国是重要的大豆贸易伙伴。2017年,美国大豆占中国大豆进口总量的30%以上。2018年3月23日,美国总统特朗普正式签署对华贸易备忘录,计划对中国输美产品加征高额关税。截至2019年12月初,美国对源自中国累计约3750亿美元的产品加征了进口关税。中美贸易摩擦形势错综复杂,中国对美方实施的反制措施中,大豆成为了举重若轻的谈判筹码。中美贸易摩擦发生后,中国对美国第一批实施对等征税措施约340
随着公路钢-混组合结构桥梁在我国的不断推广,兼具混凝土与钢结构优势的钢板-混凝土组合曲线梁桥也得到了广泛应用。在组合桥梁建设高潮来临之际,对中、小跨径钢板-混凝土组合曲线梁桥展开系统研究具有重大意义。现阶段我国钢板-混凝土组合曲线梁桥建造经验依然欠缺:对钢板-混凝土组合曲线梁桥部件划分、纵(横)桥向参数设置的研究依然不足,在具体施工过程中存在节段划分随意、集成工艺不精以及参数取值不合理的现象。因此
随着我国清洁低碳能源体系建设的大力推进,新能源装机规模迅猛扩增。由于风电的波动性、不确定性和反调峰特性及系统调峰能力不足,新能源消纳问题得到广泛关注。同时,直购电规模的扩大,传统的火电机组参与大用户直购电挤占风电上网空间,降低系统的峰谷调节能力,系统灵活性下降,进一步恶化弃风现状。因此,为了应对大规模风电并网和大用户直购电的广泛开展对电网新能源消纳率和系统灵活性的影响,本文基于博弈理论,提出了风火
碳酸二甲酯(DMC)是一种广泛应用的绿色化工原料,可衍生出多种下游产品,如硫酸二甲酯、聚碳酸酯、苯甲醚、聚碳酸酯二醇等化学品。随着工业的发展,CO2作为温室效应气体之一,大
目的视神经脊髓炎谱系疾病(neuromyelitis optica spectrum disorders,NMOSD)是一种自身免疫性中枢神经系统脱髓鞘疾病,目前认为主要的病理机制是抗体介导补体参与的星形细胞损伤及脱髓鞘。神经束蛋白(neurofascin,NF)155是主要表达于郎飞结结侧区髓鞘的一种细胞表面蛋白,在保持郎飞结结构完整和保障正常的神经冲动传导中起到重要作用。现已在多种神经系统脱髓
2019年10月18日政府间气候变化专门委员会(IPCC)在韩国仁川发布了《IPCC全球升温1.5℃特别报告》。报告指出:与将全球变暖限制在2℃相比,限制在1.5℃对人类和自然生态系统有明显的益处,同时还可确保社会更加可持续和公平。意在表明全球变暖已经是大势所趋。同时在我国,绿水青山就是金山银山的思想深入人心,在妫水河流域內“退耕还林还草”正在改变着流域土地利用及土地覆被情况。因而,流域土地覆被改
暂态稳定评估(TSA)对电力系统的稳定安全运行具有重要意义。TSA信息用于在突发事件期间做出控制决策,支撑电网的调度操作。目前,为了满足不断增长的电力需求和电力电子设备的广泛应用,系统的互连性增强,瞬态稳定性要求提升,亟需对TSA开展深入研究分析。如果无法评估暂态稳定性,可能会导致严重故障,例如断电和电源系统中的其他一些限制。不同的传感器,PMU和其他测量设备的部署由于其先进的功能和具有时间同步性
当前互联网和信息化时代飞速发展,“放管服”改革、事业单位改革和社会组织改革紧密锣鼓,经济社会发展进入新常态,社会治理主体由一元走向多元,多个主体共同参与成为了社会治
目的:环磷酸鸟苷(cyclic guanosinemonophosphate,cGMP)是一种调节心脏功能的胞内第二信使,通过细胞膜上的cGMP门控离子通道、cGMP依赖性的磷酸二酯酶(phosphodiesterase,PDE