基于深度学习的三维室内场景语义分析研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:hewanjiang1975
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着智能家居机器人、无人驾驶、虚拟现实等新兴产业的爆炸式发展,对三维场景的语义分析与理解的需求也越来越紧迫。与此同时,空间扫描技术的越发成熟,三维传感技术也取得了重大进展,大量的真实场景三维点云数据的获取也越来越容易。为此,三维场景的语义分析也越来越受到数据的驱动。由于三维点云数据的无序性,基于卷积神经网络的深度学习方法不能直接作用于点云上,而将点云数据转换为体素,采用三维卷积方法的计算开销太大,也不适用于室内场景的语义理解。为此直接基于三维点云数据的深度学习方法应运而生。Point Net是基于点云的深度学习的先驱工作,该框架能有效的提取点云特征,但在语义分析上的表现却不尽如人意。本文利用基于Point Net网络框架对室内场景点云进行语义分割,在此基础上进一步的对室内场景进行语义分析,包括目标检测和三维实例分割等。本文针对三维室内场景语义分析的研究,主要工作和成果如下:首先,本文提出了一种基于度量距离的室内场景目标检测算法。本文设计的目标检测方法是通过室内场景点云的语义分割获得各点的语义标签后,基于自定义的度量距离,通过区域增长的聚类算法,对室内场景中的目标进行聚类,从而实现目标检测。实验结果表明,对比Point Net中的BFS搜索方法,该方法具有有明显的性能优势。其次,本文提出了一种基于余弦相似度的实例分割方法。本文设计了利用余弦相似度来耦合点云特征向量与实例标签的方法;使得在实例标签的监督下,使属于同一实例的点云之间的特征向量具有较高的余弦相似度,不属于同一实例的点云之间的特征向量的余弦相似度较低。最后,我们通过改进高斯均值漂移算法对耦合实例标签的点云特征向量进行聚类,获得实例分割的效果。并在S3DIS数据集(Stanford large-scale 3D Indoor Spaces Dataset)上进行了测试,验证了我们方法的有效性,并与相关基准方法比较,我们的算法取得了良好的效果。
其他文献
在现代声纳系统中,水下目标的自动识别一直是研究的关键技术之一。近年来,随着计算机技术的兴起,基于机器学习的分类识别方法在水声领域得到了应用研究,并取得了良好的效果。与传统单基地主动声纳和被动声纳相比,多基地主动声纳具有自己独特的优点,近年来成为声纳技术的研究热点之一。那么,多基地声纳水下目标识别技术也值得开展相关的研究探索。论文主要研究内容包括:1、水下目标瞬态信号声散射场的数值计算方法与仿真实现
建设海洋强国是全面建设社会主义现代化强国的重要组成部分,海洋大数据作为基础战略资源,是衡量一个国家海洋监管能力的重要标志,随着信息技术的迅猛发展,以卫星海洋遥感数据为代表的海洋数据规模呈现爆炸式增长趋势,海洋研究进入大数据时代,如何收集、管理和挖掘海洋数据是世界各海洋强国研究的重点方向。本文以国防科技大学研制的天拓三号卫星收集的天基AIS数据作为数据支撑,结合机器学习相关算法,从分类、聚类和回归三
尽管现在的强化学习技术比较成熟,但是由于训练过程无任何先验知识,随着任务复杂度提高,训练时间也随之增长,这就限制了强化学习技术应用的任务场景。因此,将相似任务的训练结果作为先验知识模型提供给新的强化学习任务,从而解决强化学习对大量训练样本的依赖问题,提高强化学习算法的可用性和普适性,具有重要的理论意义和实际意义。针对上述研究点,本文开展了以下研究与创新:(1)提出基于先验知识模型的策略迁移方法,降
在大数据时代,深度学习在图像分类、语音识别、机器翻译等多种任务上取得了令人满意的表现,这与数据的规模、质量息息相关,更多高质量的数据可以使深度神经网络模型的性能得到极大提升。但现实条件下,只有少数机构有能力收集大规模数据,大部分机构只能掌握少量数据。面对专业领域性强、隐私要求高的数据,机构间往往不愿共享数据,且由于受到数据隐私保护相关法律法规的监管,直接传输原始数据难以实施。为了打破机构间的数据壁
故障诊断与安全监测对微加速度传感器提出了迫切需求,然而,目前在市面上主要以高精度、低量程产品为主,产品量程和部分性能不能有效满足故障诊断和安全工程领域的监测需求。本文在前期研究基础上提出一种高谐振频率、高量程、体积小、性能稳定的蝶翼式微加速度传感器。从敏感结构设计与优化、加工工艺、集成封装、主要性能测试等方面进行了系统研究,内容主要包括以下几个方面:1.敏感结构设计与优化。本文在保证主要性能指标的
随着计算机技术的飞速发展,人们对新软件的需求呈现爆炸式增长,但是现有软件的开发速度远远落后于人们对新软件的需求速度,为了缓解这种情况,代码自动生成技术应运而生。代码自动生成技术可以辅助开发人员进行软件开发,减轻开发人员的编码负担,缩短软件的研发周期,目前研究人员提出了许多代码自动生成方法。本文首先对当前代码自动生成技术和用于代码生成的神经网络架构的现状进行了分析,而后分析了目前基于深度学习的代码自
合成孔径雷达(Synthetic Aperture Radar,SAR)是利用微波进行感知的主动式传感器,其不受天气、光照等条件的限制,可对感兴趣目标进行全天时、全天候的观测,在军事和民用领域发挥了重要作用。飞机目标是战场侦察与监视的重要对象,具有高价值和时敏变化等特点,如何高效、准确地检测、识别飞机目标是SAR图像目标解译领域的重要课题,也是难点之一。当前,随着SAR传感器分辨率达到亚米级,基于
逆合成孔径雷达(Inverse Synthetic Aperture Radar,ISAR)目前已成为人们获取非合作运动目标高分辨雷达像的常用手段,雷达像的分辨率越高,其展现的目标信息越丰富。针对传统ISAR分辨率增强方法的不足,本文重点研究用于ISAR分辨率增强的深度学习方法。所开展的研究工作和取得的研究成果如下:第一章回顾了国内外ISAR分辨率增强技术的研究进展,重点分析了目前已经广泛应用的各
随着自动控制技术的发展,民用无人机越来越广泛的应用给社会带了来许多便利,但也对个人、社会、军事等领域带来了严重威胁。因此,快速高效的低空无人机检测是应对无人机威胁的前提。本文利用红外与可见光波段的光电探测手段,结合深度学习技术,开展了对低空无人机目标图像检测识别算法的研究,主要工作内容如下:(1)基于深度学习的低空无人机检测识别算法优选。首先,利用红外与可见光采集设备与3型民用无人机构建了双波段无