基于RGB图像和三维模型的物体姿态估计

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:guizi663
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
物体姿态估计技术是计算机视觉和人工智能领域中受到广泛关注的研究课题,旨在根据观测到的视觉信息估计目标物体在场景中的三维位置和三维朝向。这项技术可以广泛应用在视觉引导机器人抓取、增强现实和自动驾驶等领域中,具有十分重要的应用价值和理论研究价值。而当前仅以RGB图像作为输入的物体姿态估计方法由于缺少深度信息、直接估计目标物体在三维空间中的姿态的准确率较低,且在严重遮挡情况下物体姿态估计算法不够鲁棒。这些问题阻碍了物体姿态估计方法在现实当中的应用。本文致力研究如何充分利用已知的目标物体三维模型信息提高基于RGB图像的物体姿态估计方法的准确率,主要工作如下:(1)提出了一种基于单张RGB图像和三维模型的物体姿态估计方法,在物体姿态初始化步骤的基础上,迭代地进行5个步骤:三维模型渲染、图像预处理、特征提取、物体姿态偏差估计和姿态更新。该方法采用了一种新的物体姿态表示方法、网络结构和姿态更新策略,且在训练过程中通过损失函数的设计充分考虑了目标物体的对称性。我们用平均点距离、平均最近点距离为指标来衡量预测的物体姿态和真实姿态之间的偏差,在Occlusion LINEMOD和YCB-Video数据集上进行对比实验。通过实验对比,本文详细地分析了算法参数对性能带来的影响。与其他方法相比,本文提供的方法在公开数据集上实现了更高的准确率。(2)提出了一种基于多张RGB图像和三维模型的物体姿态估计方法,利用同场景不同视角下物体姿态的关联性来解决遮挡情况下单视角物体姿态估计方法估计错误的问题。该方法通过4个步骤:单视角姿态估计、物体姿态假设匹配与视角变换矩阵的计算、场景最优物体姿态估计和物体姿态估计结果变换与边界处理来保证不同视角下物体姿态估计的一致性和准确性。在YCB-Video数据集上的可视化结果和实验对比数据表明:本文提出的基于多张RGB图像和三维模型的物体姿态估计方法可以有效更正单视角物体姿态估计的错误结果,从而提高物体姿态估计的准确率。
其他文献
发动机前端附件驱动(Engine Front End Accessory Drive,EFEAD)系统是汽车上一个重要的传动系统。发动机曲轴输出的动力通过该系统中皮带传至空调压缩机、转向泵、发电机和风扇等附件轮上。传动所用的皮带包括多楔带、V型带和正时带等,目前EFEAD系统动力传递广泛采用的是多楔带,因其具有接触面积大、传递功率大、楔面和背面均能传动、轮系布置紧凑和方便维护等优点。然而,EFEA
目前,对于工程结构的研究和规范大多集中在地震作用和风荷载对结构的影响上,开展结构在随机荷载作用下的动力响应随机模拟分析,对抗震和抗风设计具有重要意义。工程结构减振设计一直是土木工程结构的重要研究方向,尽管工程结构减振技术已有较长的发展历史,但关于结构在随机荷载作用下,对减振设计中减振装置(如粘弹性阻尼器等)的位置和数量进行优化设计的研究尚不常见。因此,本文的主要研究内容是开展结构地震响应和风振响应
随着时代的发展,健康问题越来越受到人们的重视。据调查显示有70%的人都处于亚健康状态。中医是一门重要的“治未病”和无创诊断模式,与亚健康以个人感受为主而无明显病症的定义非常契合。随着近年来中医诊断客观化研究的不断深入,为中医辨识亚健康状态提供了无限可能。本课题结合中医理论设计了一款基于中医理论的小巧型人体双模态生理信息采集系统,主要包括脉象采集子系统和舌象采集子系统;脉象采集子系统设置有三部独立压
相变储能技术是一种能够协调能量供需时间和空间不匹配的矛盾、提高能源利用率的新型节能技术,将具备储热特性的相变材料(PCM)应用于建筑采暖系统中,可以提升室内热舒适性,将用电负荷转移至非高峰期,从而达到电力“移峰填谷”的目的。十二水合磷酸氢二钠(Na2HPO4·12H2O)作为一种高潜热、廉价易得的无机水合盐相变材料,相变温度在36℃左右,适用于建筑采暖系统,具备广阔的应用前景,但严重的过冷和泄露问
图像修复技术的目标是实现对图片中的缺损区域进行修补,并使得修补后的图片具备真实性,是计算机视觉领域的关键技术。目前随着生成对抗网络与变分自编码器等图像生成技术的快速发展,众多科研人员投入到基于深度学习的自然场景图像修复研究中,而专门针对人脸的图像修复研究还相对较少,由于人脸其具有复杂且多样的结构,在自然场景下实现的模型不一定适用于解决人脸图像,并且人脸图像的研究在生活中有广泛的应用场景,基于此,本
DC-DC变换器是一个复杂系统,具有多尺度特性。通常,宏观尺度描述的是电路的整体工作原理,而微观尺度则主要涉及电路元器件的机理模型。仅在宏观尺度上的建模不能反映器件内部效应对整体电路的影响,而在微观尺度上建模则不能展示电路的工作特性。因此,综合分析不同尺度之间的相互影响,建立多尺度统一的模型对于DC-DC变换器的分析具有重要意义。为了获得DC-DC变换器状态变量在电路级和器件级尺度下的解析解,本文
碳纸是应用最为广泛的气体扩散层基底材料。为满足燃料电池的运行工况,碳纸需要具有均匀的多孔结构、良好的导电/导热性、一定的机械强度和高的化学稳定性。其中,良好的导电性有利于降低电子传导过程中的损耗,从而提高电池性能。碳纸的导电特性通常采用提高石墨化温度和添加导电碳质粉体进行改善。然而,较高的石墨化温度导致碳纸的机械强度降低,脆性增加,同时提高了其生产成本。添加导电碳质粉体可以提高碳纸的导电性能并保持
社会各个领域的问题都离不开计算机科学,而计算机学科中的优化问题是当下重要的研究热点。进化算法是具备随机搜索能力的启发性搜索算法,具有鲁棒性并且不依赖求解问题本身的数学特征,是解决优化问题的高效手段。但是随着信息化时代的不断发展,云计算、大数据以及高性能计算技术的出现使得传统的串行执行的进化算法面临严峻的挑战,如求解问题复杂、数据量庞大、计算成本高昂、实时性要求高等。因此,进化算法的并行化需求与日俱
大数据技术的快速发展和广泛应用推动了我国的数字化建设,但随其产生的大量数据也不可避免地造成了严重的“信息过载”问题。为帮助用户从海量数据中选择出符合自己兴趣偏好的物品,推荐系统应运而生。评论文本作为用户问题、建议、态度的载体,能够有效挖掘用户的兴趣偏好而在推荐系统中被广泛关注。然而,现有基于评论文本的推荐方法不仅推荐结果可解释性弱,而且未考虑评论数据的稀疏性。因此,为解决上述问题,本文提出了一种融
锂离子电池因其高能量密度、高输出功率等优点,受到新能源汽车领域的广泛关注。热安全性一直是制约电动汽车发展的关键问题之一,合适的热管理方案能有效地提升电池性能、保障电池安全,对于新能源汽车的推广和应用具有重要意义。热管作为一种高效的导热元件,具备在狭小空间内实现热量高效传递的能力,在动力电池热管理中极具应用前景。在此基础上,本文设计了一种基于热管的电池冷却系统,并对影响系统冷却性能的因素展开了相关研