面向人机共居的移动机器人室内深度估计方法研究

来源 :深圳大学 | 被引量 : 0次 | 上传用户:mkkkj2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,越来越多的服务类机器人进入人们的生活。在人机共居的环境下,机器人既需要完成任务,又需要与人保持适当的距离,做到及时避让。传统的机器人避让方法,往往使用激光雷达、深度相机和传统的视觉处理算法,前两种方法成本过高,而传统的视觉处理算法会受光照等因素影响,并且过程也尤其繁琐。针对以上缺点,本文通过低成本单目相机,结合基于深度学习的深度估计与人体检测算法,仅用单张图片即可检测到人体,同时得到人体的深度信息,让机器人在正常运行的同时能够对人及时避让,因此本文的主要工作可分为以下四个部分:1)针对传统深度估计方法过程复杂且计算量大的缺点,本文使用深度学习来进行深度估计。但是目前大多数基于深度学习的深度估计都是采用回归的办法,用均方差最小化训练回归网络,并用跳连接层来获取高分辨率的深度图,因此会存在收敛速度缓慢、不理想的局域解和网络训练复杂等问题。在此背景下,本文提出一种深度空间递增离散化策略来将深度值离散化,并作为一个有序回归问题来训练网络,最后通过构造一个有序回归损失函数,来获取更高的精度和更快的收敛。2)针对以往人体检测算法在定位阶段矩形框精度不够的缺点,本文通过对候选框区域、特征金字塔与损失函数进行平衡优化来进一步提高模型性能,提高定位精度。3)针对卷积神经网络训练过程中大量参数反复更新导致训练速度较慢的问题,本文提出了基于卷积层与BN层权值冻结的模型压缩剪枝方法,在反向传播阶段,通过对不同卷积层和BN层的权值进行冻结,使整个神经网络的更新参数按照一定的比例更新,再根据模型的准确率选出最优的冻结层数,这可为后续模型迭代节省大量时间。4)本文将深度学习与边缘计算相结合,通过对Atlas 200 DK嵌入式开发板进行环境搭建,并将训练好的模型移植部署到开发板上,同时结合移动机器人,在实际场景中验证本文算法的有效性。实验结果证实本文通过低成本的单目相机结合深度估计算法,仅用单张图片即可在人机共居的环境下让机器人对人成功进行避让。
其他文献
互联网时代下,传统行业的数字化转型步伐越发加快,传统数据管理中心已无法满足当前爆发式增长的数据存储需求。分布式存储系统因其低成本、高容错性、扩展性好、存储容量大等优势成为了当前存储技术的发展趋势。但分布式存储系统搭建在廉价的PC节点上,随着系统节点规模的不断扩大,节点失效问题也越发严重,因此如何高效地保障分布式存储系统的可靠性成为学术界和工业界重点研究的问题之一。当前主要的两种保障系统可靠性的技术
近年来,可视化成为了最为流行的数据展示及数据分析技术,广泛应用于各种领域。可视化就是将数据以视觉图像的形式呈现给用户,为了使用户更好的理解和解析数据,设计人员会通过调整不同的视觉通道来改善最后的可视化结果,例如对应的大小、位置、形状还有颜色等。而在这些视觉通道中,由于颜色本身的属性比较复杂,也是影响视觉效果的主要因素,所以其优化的效果非常需要重视和研究。对于颜色的优化效果,本文提出从感知性与和谐度
随着城市规模的不断扩张,城市社会经济的多样性和复杂性也随之增加。作为城市社会经济活动重要载体的城市空间,其形态和结构也在这个过程中变得错综复杂,人口和信息、能量、资金等要素在不同的城市功能区之间进行流动,城市规模的扩大,这些流动在强度上和复杂程度上都有显著的提高。如何科学的认识城市功能区之间的交互关系,并在此基础上合理地对城市中不同功能区在空间上进行安排,既有利于提高人口和信息、能量、资源等要素在
技术高度发展的今天,人们在生活、工作、学习、研究等各个领域中都会涉及布局设计,比如进度汇报、工作总结、商品展示、成果演示、海报制作等。用户在使用现有图形编辑工具布置元素时,常常希望得到协助,从而能够快速便捷的得到期望的元素布局。他们希望能被指导,而不是漫无目的在调整元素位置上浪费时间;希望可以直观比较,而不是在不同方案之间反复切换消耗时间;希望能够避免简单重复的实现工作,并且他们的设计意图能够被系
随着半导体技术的不断更新,物联网、人工智能和5G通信等应用领域的不断发展以及电子产品功能的不断复杂化,对电源管理模块最大电流能力要求也不断增加。对于在电源管理类芯片中应用最广的低压差线性稳压器(Low Dropout Regulators,LDO),由于芯片封装大小以及散热的限制,使得单个LDO芯片能提供的最大电流也受到限制。而LDO的并联方案是解决该问题、提高电源系统最大电流能力的有效途径,但简
当前,中国人口老龄化问题日益突出,持续的老年人口增长将大众的视野聚焦到了老龄化相关的社会问题上,其中老年人的社会交往问题是重要问题之一。老年人退休后的社交圈子从社会工作转向了家庭邻里,社会联系的减少使得他们从心理上更需要与人交流,社会交往活动能够帮助老年人重新建立新的社会角色,构建新的社交网络,有利于老年人身心健康。住区户外活动空间是老年人群体进行日常交往活动的主要场所空间,其空间环境品质直接影响
随着快速城市化进程的推进,深圳市率先遇到了土地及空间资源约束的瓶颈,空间资源难以为继成为推进城市建设的主要障碍。与此同时,城市建设吸引的人口迁移、城市更新引发人口结构的变化以及教育政策的不断放宽将会对教育资源产生巨大的新增需求。现有教育设施难以满足激增的人口规模需求,导致教育设施的供需矛盾日趋凸显。在土地稀缺和人口增长的双重压力之下,城市更新成为空间资源获取的主要途径,通过城市更新完善教育设施配置
近年来随着人工智能的快速发展,自动问答系统备受瞩目且发展前景广阔。在生成式自动问答系统构建过程中,面临着由于知识匮乏而带来的生成不准确的问题。针对这个问题,本文将领域词典和知识图谱这两种不同形态的外部知识信息融合到深度模型中,增强对问句的理解,从而提高生成答案的准确性,研究内容如下:(1)针对生成式自动问答系统缺乏外部知识而导致的生成不准确问题,本文提出融合领域词典和拷贝机制的答案生成模型(LEP
图像风格迁移是指给定一组内容图像和风格图像,合成一张结果图像,该图像既保留内容图像的内容,又体现风格图像的艺术风格。图像风格迁移是计算机图形学、图像处理等领域的基础问题之一,在图像处理、艺术创作以及影视特效等方面有着广阔的应用前景。近几年里,随着深度学习的发展,虽然图像风格迁移方法的研究取得了重大进展,但是在实现图像任意风格迁移时,如何同时保证速度和图片质量,仍有待进一步解决。当今先进的图像任意风
在线投资组合选择的目标是在一组资产之间按某种比例分配资金,以最大化累积财富。现有的在线投资组合选择大多侧重于收益最大化,而缺乏有效地控制风险。并且许多风险控制算法使用最大回撤、夏普比率等作为风险指标对算法进行优化。但这些风险指标对短期内的风险并不敏感,往往会造成该类风险控制算法无法及时地控制短期风险,导致算法整体的风险控制效果不佳。针对上述问题,本文对在线投资组合的风险控制问题进行了如下研究:1)