基于轻量网络的目标检测与机械臂位姿估计

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:tomlibu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着深度学习的发展,在机器人技术领域研究人员越来越关注基于深度学习的机器人技术。精确且敏捷的机械臂在装配行业中已经广泛应用了几十年,但是在家庭环境下应用仍然是一个具有挑战性的工作。视觉信息的补充可以使任务变得容易一些,只包含视觉传感器的机械臂也能完成抓取等任务。基于纯视觉的机械臂抓取的一般流程为:(1)标定相机,得到焦距等相机内参以及相机坐标系与世界坐标系的位置关系即相机外参;(2)获取图像进行目标物体检测,得到目标物体的像素坐标,进而得到物体的三维坐标;(3)估计机械臂姿态,得到机械臂各关节角度,进行运动学解算控制机械臂进行抓取。本文讨论深度学习在基于纯视觉的机械臂抓取领域中的应用,研究的重点在于基于深度卷积网络的目标检测、基于深度关键点检测网络的机械臂姿态估计与网络模型轻量化三个方面,旨在为廉价机器人系统配备计算机视觉算法。现实生活中物体种类繁多,当有新的物体出现时需对原模型进行再训练。QRCode二维码具有信息存储量大、鲁棒性强的优点,我们可以方便的将二维码粘贴到物体表面,码中的存储内容也可以进行实时更新。故本文以QRCode二维码为目标物体,研究了基于深度神经网络的目标检测算法;还研究了基于视觉的机械臂姿态估计方法,以实时估计OWI-535机械臂各关节角度以及相机与机械臂之间的位姿,该机械臂依靠普通舵机进行传动,完全依赖视觉输入,无其它任何传感器;并针对现有神经网络模型较大且不易在CPU系统上实时运行的缺点,对模型压缩的有关方法进行了研究实验。本文具体工作如下:(1)对QRCode二维码检测方法进行了调研,重点研究了基于深度神经网络的检测方法,并选择了单阶段目标检测网络YOLOv3作为基础模型。构建了一个大规模的QRCode二维码图像的目标检测数据集进行模型训练,并开发了基于ZBar二维码检测库的自动标注算法,该数据集约有QRCode二维码图片2万张。(2)研究了不同的模型压缩方法,并从两个方向对YOLOv3进行了轻量化改进。首先对YOLOv3的网络结构进行了轻量化设计,对主干网络和检测网络都进行了轻量化改造,得到了模型大小为2.4Mb的轻量网络,模型m AP值为90.1%。又对YOLOv3网络模型进行了剪枝压缩,在预训练阶段得到模型大小为220Mb、m AP值为98.1%的YOLOv3模型;接着对网络进行稀疏化训练并进行通道剪枝和层剪枝,得到了大小为2.2Mb、m AP值为96.8%的轻量化YOLOv3模型。使模型大小压缩100倍的同时,也使精度得到了有效保持。(3)研究了机械臂的位姿估计方法并利用双目相机获取物体的三维坐标。首先对关键点检测网络Simple Baseline进行轻量化改进,使用虚拟合成数据与真实数据共同训练模型,并通过该网络获取图像中在OWI-535机械臂上预定义的17个关键点的像素坐标,然后由机械臂尺寸等先验信息通过最小化重投影误差进行三维重建,得到机械臂的四个关节角度以及机械臂基座与相机之间的旋转、平移向量共10个位姿参数。得到目标物体的三维坐标与机械臂关节姿态后,便可控制机械臂进行抓取。
其他文献
随着科技的进步,越来越多的移动设备都配备了前置摄像头,同时由于人脸特征采集简便,使用简便,人脸特征在人们日常生活中的应用越来越广泛,包括人脸解锁、刷脸支付等。但是由于人脸图片易于获得,甚至可以使用从互联网上下载图片对人脸识别系统进行欺骗攻击,因此就有必要增强人脸识别系统的安全性,增加人脸活体检测功能。本文重点研究了基于纹理特征和基于深度学习的方式进行人脸活体检测,主要内容如下:(1)为了论证人脸活
2020年初,一场没有硝烟的战争在全国各地打响。全国人民万众一心、众志成城为打赢这场疫情阻击战贡献出自己的力量。而我们教师本该赴一场与春天的约会也因此按下了暂停键,各
会议
随着新一轮基础教育课程改革的开展,我国教育事业又一次迎来大变革。新课程改革要求全面提高学生的语文素养,注重对学生实际能力的培养,并突出强调教学与生活的联系以及课程资源的开发和利用等新的课程理念。如何在当下中学语文教学中有效地落实新课标理念是首要任务,而姚竹青的“2567”教育理念在诸多方面都与当下义务教育语文课程标准的内容不谋而合,且他在多年的教学实践中取得了很好的成效。因此,研究他的“2567”
在工程总承包成为中国工程建设项目发包模式中重点发展方向的背景下,我国工程总承包相关政策的出台成为推动其快速发展的重要因素,而近些年学术论文和理论研究中政策文本分析的应用领域广,同时相关方法较为成熟,有助于工程总承包政策的研究分析。然而目前学者较少有从政策文件的视角进行研究分析,忽视政策对工程总承包的重要作用,同时已经出台的工程总承包政策的具体实施效果是否达到良好的效果也是关键问题,故针对工程总承包
2018年8月,国务院国有企业改革领导小组启动开展国企改革"双百行动",旨在选取百余户中央企业子企业和百余户地方国有骨干企业,在2018年一2020年期间,全面落实"1+N"政策文件要
会议
分析程序是否具有异常行为是保护操作系统安全的有效措施之一。程序运行时指令流既能体现程序的执行路径,又能反映程序运行时的行为特征。因此,基于程序动态指令流来分析程序的行为是一种常用的程序分析方式。但是,就指令流分析中的指令采集而言就存在着诸多困难。一方面需要高效获取程序运行时产生的指令流信息;另一方面需要过滤掉无用的指令流信息。因此,急需一种高效的指令流采集方案。基于双视图技术,利用Intel Pr
GIS技术自上世纪60年代以来进入中国后,在地理信息的采集、分析与应用中起到了日益关键的作用。我国的地理国情监测工作逐渐铺开,各省级国土规划主管部门分别组织开展了省级地理国情信息的普查与监测工作,并与国家局一道建立起了定时、定量的常态制度。从城市管理的角度来看,国家级、乃至省级的地理信息普查颗粒偏大,普查内容较为宽泛,其普查及监测成果并不能完全满足城市管理与发展规划的实际需要。为了解决这一问题,济
城市的道路交通状况是一个地区政府管理水平的重要体现,更是切实关系人民群众幸福指数的一个重要因素。当前,随着城镇一体化步伐的加快,像很多大中城市情况类似,县级地区的城区道路也出现了停车难、交通秩序混乱等交通管理的问题。本文从S县城区道路交通工作的现实情况为出发点,通过发现问题,分析问题,解决问题的方式,剖析了目前S县城区道路交通管理现状,利用文献法、调查研究法和参与式观察法对S县城区道路交通问题开展
近年来数据量的爆炸、算法的不断改进、硬件的持续创新使深度学习理论与应用发展迅速。在自然语言处理领域许多问题中,使用深度学习方法的效果优于传统方法。文本分类是自然语言处理的重要应用之一,多年来一直被广泛研究。文本表示与选择神经网络是使用深度学习方法解决文本分类问题的关键步骤,对于文本分类效果有着决定性的影响。目前,主流的文本表示方法有One-Hot与词嵌入两种,常用的神经网络包括标准神经网络、卷积神
随着血液透析技术的快速发展和广泛应用,国外生产血液透析机的大企业都有一些比较成熟的产品推向市场,并且各自的产品各有其特点,只有把握这些特点才能更好地使用于临床医疗
会议