【摘 要】
:
深度学习作为人工智能领域的主要技术,已成功应用于解决各种二维图像处理问题,但由于二维图像的局限性,难以完成复杂的场景分析。近年来,3D采集技术飞速发展,3D数据越来越容易得到,点云作为三维数据的典型代表不仅包含目标的空间位置信息,也包含目标的几何结构信息,相对二维图像有着天然的优势。鉴于深度学习技术强大的特征提取能力,使用深度学习方法处理点云成为了当下的研究热点,但由于点云是一组离散点集,具有无序
论文部分内容阅读
深度学习作为人工智能领域的主要技术,已成功应用于解决各种二维图像处理问题,但由于二维图像的局限性,难以完成复杂的场景分析。近年来,3D采集技术飞速发展,3D数据越来越容易得到,点云作为三维数据的典型代表不仅包含目标的空间位置信息,也包含目标的几何结构信息,相对二维图像有着天然的优势。鉴于深度学习技术强大的特征提取能力,使用深度学习方法处理点云成为了当下的研究热点,但由于点云是一组离散点集,具有无序性、刚体变换、点与点之间缺乏相互作用等特点,使得此类任务仍面临着巨大挑战。因此本文提出基于多特征融合的点云分类与分割网络,旨在实现网络旋转不变性的同时充分利用局部特征和全局特征优化分类分割网络性能。本文的主要研究内容如下:(1)针对现有算法在识别旋转点云时表现不佳的问题,本文设计并实现了一种基于椭球拟合的旋转不变网络。通过前置网络模块中的椭球拟合算法唯一标识原始点云的方向得到旋转不变坐标系,再将原始特征映射到该坐标系中,利用空间信息和角度信息进行编码得到点云的旋转不变特征。此外,为了获取更丰富的几何信息,在分类分割网络中加入多层级的特征连接增强特征传播及复用,提高模型表征能力。实验证明该算法可以有效提高网络在旋转点云上的识别准确率。(2)为了更好的提取局部特征并充分利用点云所携带的信息,本文设计并实现了一种多特征融合网络。提出基于图的邻域边缘特征提取模块,将点云转换为图结构,再利用空域上的图卷积实现邻域边缘特征的提取;引入注意力特征融合层将边缘特征与上述旋转不变的全局单点特征融合,捕获更具有鉴别力的局部特征描述符;最后,在融合后的高维特征中应用关键点检测技术,根据点的法线变化来区分每个点的重要程度并分配不同响应,进一步增强模型的表征能力。实验结果表明,该算法能够有效提取具有鉴别力的点云特征,显著提升网络的分类和分割精度。
其他文献
随着具备多种编辑功能的音频软件的广泛流行,非专业人员为了私人目的也可以随意便捷的对音频文件进行各种编辑甚至是恶意篡改,这给检测音频的真实性带来了巨大的挑战。其中,同源复制粘贴篡改和异源拼接篡改是改变音频原始含义最重要的两种篡改方式。同源复制粘贴篡改操作是将原始音频中的某部分信息复制并粘贴到该音频的其他部分,因此原始片段与篡改片段之间高度的相似性致使检测十分困难。异源拼接篡改操作是将两段不同设备录制
近年来,随着新能源汽车大规模接入电网,对电网调节能力以及能源储备的要求不断提高。全球能源短缺问题的日益凸显以及人类环保意识的日益提高,促使绿色能源开发强度不断增大。自中国在第七十五届联合国大会上提出碳达峰、碳中和的“双碳”目标以来,世界各国有关于能源转型路径的关键判断趋于一致。为了能够早日实现“双碳”目标、提高能源储备量,增强能源系统的储备与调节能力显得尤为重要。本文以车网协同技术为基础,结合主流
边缘智能作为边缘计算与人工智能的结合,旨在将人工智能应用推向靠近终端的网络边缘。以深度神经网络模型(DNN)为核心的人工智能应用在边缘智能场景中存在计算时延高的问题,所以在此场景下对DNN计算进行加速是目前的研究热点。模型分割作为一种新兴技术,能有效地减少DNN的推理时长,但目前的研究仍然具有不足之处。本文研究了在“端-边”二层架构和“端-边-云”三层架构下的模型分割调度策略,针对具有截止期限的D
近年来,由于公共安全的迫切需求,安防行业蓬勃发展,但是多数安防管理仍然以低效率的人防为主,智能的监控系统亟需被构建,而行人再识别技术是其不可或缺的关键技术之一,已成为计算机视觉领域的研究热点。行人再识别是非重叠视域中特定行人的检索问题,即判断在某个摄像机中出现的特定行人是否出现在其他摄像机中。目前,监控摄像机一般采用可见光-红外双模式交替以实现全时段的日夜运行,由于实际应用需要,可见光-红外行人再
随着北斗卫星导航系统的全面建成,相关产品和服务的应用范围也越来越广,人们对于卫星导航定位的精度要求也越来越严格,为了获得高精度的导航定位结果,必须准确的探测到卫星信号的周跳。现有的周跳探测方法有很多,但是存在不适用于单频数据,难以探测小周跳,周跳探测精度不高,没有考虑载波相位数据时序特征的问题。根据载波相位数据的时序特征和长短期记忆网络的特点,本文提出了一种基于深度学习的卫星信号周跳探测方法,并通
在现代战争中,雷达工作的电磁环境日益复杂。主瓣干扰信号从雷达接收机的主波束进入,对雷达系统进行屏蔽或欺骗,严重降低了雷达系统对主瓣目标的检测性能。如何对抗雷达主瓣干扰,提高雷达系统在主瓣干扰环境下的探测能力,成为电子对抗领域的核心研究方向之一。近年来,盲信号分离技术被用于直接处理接收信号而无需先验知识,且易于工程实现,具有对抗主瓣干扰的巨大潜力和优势。因此,本文聚焦盲信号分离技术,围绕盲源分离(B
紧凑环(CT)是一种具有自组织结构、高密度和高速度的等离子体团。CT是在紧凑环注入装置上形成并加速,是动能、热能和电磁能的载体。由于其具有这些特性,常常被用在聚变装置的加料上。作为一种新型加料方式,它具有非常大的潜力实现聚变装置的芯部加料。CT还可以用于磁重联、磁靶向聚变和空间等离子体推进等研究领域上,具有非常广泛的应用前景。本论文主要研究内容有EAST-CTI紧凑环注入系统的搭建和测试,放电参数
随着现代社会科学技术的飞速进步,为了满足人们日益增长的信息需求,研究一种新型大容量通信技术已成为当前通信领域的研究热点之一。涡旋光束由于其本身携带轨道角动量(Orbital Angular Momentum,OAM),且携带不同OAM的涡旋光束之间相互正交,因此可作为扩充信道传输容量的信息载体应用到光通信领域。目前,基于OAM的新型光通信技术已成为自由空间光通信领域的热门研究方向之一。对于一套高效
合成孔径雷达(Synthetic Aperture Radar,SAR)由于其出色的性能和广泛的应用,自诞生以来得到了广泛的关注。SAR在深度上和广度上不断地发展,分辨率和成像范围不断地提高,出现了多种工作模式以及新颖的成像算法。广域检测是SAR技术发展追求的目标之一,传统的广域目标检测系统中大多采用多普勒波束锐化(Doppler Beam Sharpening,DBS)成像方法,DBS虽然能够大
群体行为识别是计算机视觉领域一项具有挑战性的任务。不同于个体行为,群体行为过程具有复杂的多人关系,发现群体中关键的交互行为具有重要的研究价值。群体中个体的行为具有多样性,特征信息复杂。群体的交互行为具有时间动态性,交互信息难以获取。本文在总结现有群体行为识别方法的基础上,考虑到个体行为的多样性和群体行为的时间动态性,主要解决了群体行为识别任务中以下几个问题:第一,在个体特征信息复杂的情况下,如何实