基于单目视觉的空间定位研究

来源 :王志宏 | 被引量 : 0次 | 上传用户:zhangjianmei88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
定位在人们的生活中越来越重要,目前有常见的GPS、WIFI、雷达、传感器的定位方法,这些方法受限于信号覆盖、和应用成本等,在使用上有一定的局限性。基于计算机视觉的空间定位则在环境适应性方面具有独特优势,设备简单、成本低,因而有广泛的应用前景。基于视觉的定位有单目和双目两种,单目视觉定位对设备要求更低且部署灵活,而更具推广价值。该方法通过在多幅图像内容匹配的基础上反演相机拍摄的位置、角度来实现定位。图像匹配是单目视觉定位的关键技术,需解决误匹配、计算量大、匹配率低等问题。目标数量少参照物数量少和光照复杂等实际应用场景加大了图像匹配难度,上述问题更加突出。本文针对单目视觉定位的图像匹配问题,利用注意力机制对数据中具有更多有价值信息的位置增加关注度,使得图像匹配算法获得更加稳定的特征向量,提高匹配的准确性。在位置反演方面,使用GAN算法扩充室内应用场景数据集,为Pn P位置反演算法提供更多的参考点,从而提高空间定位精度与实用性。本文提出的算法,在公开数据集和构造的室内数据集上都有进行评估与验证。本文主要研究工作及成果如下:(1)基于注意力机制的Key.Net图像匹配改进。Key.Net算法将先验知识和浅层多尺度CNN网络结合,通过神经网络来表达人的先验知识,但是多通道卷积过程中,没有突出不同通道的重要性。本文将Key.Net算法与CBAM算法结合,提高了对于特征向量求取的准确性。另外针对视觉定位的图像匹配可能出现的欠匹配问题,采用迭代策略,在特征点稀疏的图像中找到更多的匹配点。(2)引入多尺度的图像匹配算法改进。带有注意力机制的Key.Net算法较好地把先验知识融合进浅层CNN网络,但由于网络深度多尺度特征不够丰富。视觉定位环境应用中存在大的尺度差异,受SIFT算法中高斯金字塔的启发,本文将多尺度信息引入Key.Net算法,即ATKey.Net。模型在Image Net数据集上进行训练,用HPatches基准进行测试,结果表明该算法在可重复性和匹配性能方面优于基线算法。(3)位置反演方法改进。数据样本量对位置反演的精度有很大的影响。本文基于GAN算法对用于位置反演的数据进行扩增,并应用于Pn P算法,改善了3D到2D点由于数据量少导致位置精度低的问题。(4)基于ATKey.Net图像匹配算法和Pn P算法的视觉定位应用。将所提出的ATKey.Net算法和不同的图像匹配算法用于Aachen Day-Night数据集求取特征向量,并使用Pn P算法进行相机位置反演。实验表明在视觉定位精度上所提出的算法对比基线算法具有优越性。
其他文献
战术互联网(Tactical Internet,TI)作为机动作战部队最为关键的通信网络,是数字化军队建设的基础。战术互联网是战术无线电台、交换路由设备、计算机软件和硬件设备的集合,通常用于保障态势感知、指挥控制、协同作战等信息在各军事通信系统之间的无缝传输。随着信息通讯技术的不断发展,网络战、电子战成为现代战争中主要的作战方式。网络空间安全已成为各国军队争夺的重要战略资源,网络攻防靶场作为网络技
学位
射频识别技术(Radio Frequency Identification,RFID)是一种非接触自动识别技术,被广泛应用于仓库货品管理、生产制造、车辆自动收费系统、医药和金融等领域。特别是在船舶智能物流管理系统中,RFID子系统已经成为了必备部分。天线是RFID读写器不可缺少的单元,它的小型化、高隔离度、双频段和双极化等功能均有重要的实际应用价值。论文针对小型化、高隔离度、双频段和双极化RFID
学位
随着搜索引擎的普遍应用,使用搜索引擎投放目标广告是目前互联网公司如百度、美团、头条、阿里等各大企业收入的主要来源之一。对搜索引擎广告进行模型评估,无论是提高用户体验满意度,还是迭代改进搜索引擎广告模型,都具有十分重要的意义。搜索引擎广告模型的效果评估主要体现在搜索词与搜索结果的相关性(Relevance)上。目前对于相关性的评价主要采用A/B testing方式,此方法会导致有真实的流量流入迭代后
学位
随着外卖行业的稳健发展,现在的外卖市场已经趋于饱和,呈现出“2+N”的市场格局[1]。美团外卖、饿了么两大外卖平台已经占据了95%以上的市场份额,体量增长达到瓶颈。与此同时,细分品牌或细分外卖品类的宅急送、麦乐送等自营平台,仅服务于自家的餐饮企业。这类垂直类餐饮企业有着庞大的顾客群,但本身所具备的运力不足以支撑庞大的订单量。另一方面,外卖平台商家多、品类广,因此用户粘性较高,垂直类餐饮企业的在线订
学位
随着电商领域的发展和消费者购物方式的改变,人们在线上购买快速消费品的需求越来越强烈。快速消费品,简称快消品,是指那些寿命较短、产品消耗速度较快的消费品。相对于耐用消费品等行业来说,快消品是一个独具特色的领域,它在采购、营销、存储上都表现出不一样的特色。受疫情影响,线下的快消品商家在销售商品时遭到了一定的冲击。越来越多的消费者更倾向于线上购买商品,通过物流快递的方式配送到家。在市场竞争激烈的情况下,
学位
随着建筑业的快速发展,规模大、技术要求高的建设项目逐渐增加,业主对项目的施工和管理经验不足,技术团队和力量薄弱,PMC模式作为一种项目管理承包模式逐渐被应用。由于PMC模式是一种“委托-代理”的特点,PMC管理承包商在代表业主进行招标中,一方面承担自身制度以及管理不善带来的风险,另一个方面承担来着业主通过PMC模式嫁接过来的政策、社会和经济等风险,再加上PMC模式的特殊性,使招标工作面临着更大的风
学位
本文依托东北地区某城市轨道交通出入线段富水浅埋连拱隧道工程,采用理论分析、数值模拟和现场实测相结合的方式研究分析了流固耦合作用对富水浅埋连拱隧道施工产生的影响;并基于Flac3d5.0有限差分软件通过控制变量法对浅埋连拱隧道在流固耦合情况下在隧道不同施工工况中的隧道的开挖方案、围岩的饱和度、隧道施工的开挖步距和连拱隧道左右隧洞开挖间距这四个影响因素进行数值模拟研究分析;依托有限差分软件Flac3d
学位
城市轨道交通系统实现节能减排,是响应国家可持续发展战略方针,提高轨道交通行业竞争力,减少运营成本的重要举措。开展列车节能运行的研究对于减少轨道交通行业运营成本,实现节能减排具有重要意义。地铁列车的驾驶策略和运行时刻表影响着列车运行过程中的牵引能耗与制动能量回收量,直接决定了地铁系统的牵引供电能耗和运营成本。因此,采用合适的优化方法降低牵引供电能耗已成为城市轨道交通节能研究的热点问题。本文以地铁列车
学位
天线作为射频识别系统的关键部件之一,根据作用距离的不同可分为近场天线和远场天线。近场系统中,标签和读写器之间通过磁场或电场耦合工作;由于磁耦合在液体和金属环境中有更高的稳定性,在实际应用中更受青睐。远场天线辐射能力强、作用范围大,广泛应用在物流、仓储等固定和手持式的阅读器中。本文以超高频射频识别系统应用为背景,从磁耦合近场均匀天线、手持机高定向增益远场天线、近远场复用天线三个方面进行研究。本文的主
学位
高水位承压水一直是基坑开挖过程中一大难题,若处理不当,就会导致严重的工程事故,基坑工程中的基底突涌事故大多源于承压水处理不当。依托于长江北岸跨江隧道深基坑工程工作井基坑突涌事故,基于地下水渗流基本理论,借助地下水渗流模拟软件Visual MODFLOW对目标基坑进行二维渗流模拟,从坑外减压降水角度出发,分析研究承压水引起突涌事故的治理。利用ABAQUS数值模拟软件,应用流-固耦合分析方法,模拟研究
学位