基于改进SURF与APAP的航拍图像拼接技术研究

来源 :大连理工大学 | 被引量 : 1次 | 上传用户:paul5260
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着科学技术的不断发展,无人机航拍技术被广泛应用到农业、工业、军事等领域。但是受到相机视角的限制,单张航拍图像中所涵盖的内容,无法满足研究人员对信息获取的需要,因此,为了获得大比例尺、信息全面的图像需要对采集的航拍图像进行拼接。针对航拍图像具有易受光照、尺度和旋转等特性变化影响,以及图像不连续、存在视差的特点,本文以特征提取和图像扭曲变形两个阶段为切入点,致力于研究能够适应航拍图像特点的特征提取算法和图像扭曲变形方法,以提高航拍图像拼接的精度和自然度。本文的具体工作如下:为了获得高精度的全景航拍图像,本文以鲁棒性较好的加速鲁棒特征(Speeded Up Robust Features,SURF)算法为基础进行改进,针对其边缘抑制较强、错误匹配率较高的问题,提出了一种基于长距离特征的航拍图像拼接算法。主要对特征提取方法进行优化,提出Canny-SURF特征检测算法,提高边缘检测效率;同时提出L-FREAK(Long-Fast Retina Keypoint)二进制描述子代替原先SURF浮点型描述子,以提高匹配效率,并进一步提高算法对旋转变化的容忍度。仿真实验部分,通过对Mikolajczykg提供的数据集和实际航拍图像进行拼接,并将实验结果与SIFT、SURF等经典算法进行对比,验证了所提算法在拼接受各种特性变化的图像时,具有良好的鲁棒性,并且配准速度和精度都适用于航拍图像拼接。为了解决传统航拍图像拼接算法无法克服视差问题,造成拼接后图像存在鬼影、失真变形等现象,本文对配准效果较好的尽可能投影(As-Projective-As-Possible,APAP)算法进行改进,提出了一种基于直线特征约束网格变形的航拍图像拼接算法。对图像进行网格划分,并构建一个包含网格顶点信息的能量函数,使用APAP算法的局部单应性约束对齐局部细节,通过相似性约束保证图像的自然过渡和失真矫正,然后辅以直线保护约束,避免变形过程中导致场景直线结构产生弯曲,最后在稀疏线性系统求解最小误差解得到最优网格顶点集,指导图像扭曲变形。为了验证所提算法的有效性,将其在多组标准数据集上进行拼接验证,实验结果表明,与Auto Stitch、APAP等算法相比,所提算法综合性能较强,能够减少鬼影、失真问题。另外,将所提图像扭曲变形方法应用于实际采集的带有一定视差的无人机航拍图像,拼接的图像局部细节对齐良好,相比原APAP算法,图像自然度显著提高,非重叠区域失真也得到了改善。
其他文献
定制产品设计和生产制造过程中,制造商常邀请用户通过虚拟体验等方式感知产品性能。通过分析用户完成产品体验后发表的用户评价,了解产品设计的不足与缺陷,从而有针对性的完善产品性能,使定制产品更加适应用户需求。情感分析技术是一种基于句法分析和机器学习的文本观点提取与情感判断方法,在文本数据分析处理过程中,它可以基于文本数据近似模拟出文本特征与其情感倾向的关系。与人工分析文本相比,文本情感分析技术能够有效缩
目前,随着信息时代的高速发展和计算机计算能力的不断提高,人机交互的情绪识别是发展最快的研究领域之一。为了提高人机交互的效率,增强计算机识别情绪的能力是十分重要的。当前情绪识别的研究大多集中于人的面部表情、声音、文本等方面,而人体运动的情绪识别任务较少受到关注。然而,日常生活场景较为复杂,可能出现面部表情、语音等失效的情况,这时空间尺度更大的肢体动作情绪识别往往能够发挥更大的作用。现有的情绪识别数据
近年来,国家司法改革不断深化,随着司法机构数字化程度不断提高,法律文本数据信息出现了指数级的急速增长,海量司法文书的高效分析与处理成为亟待解决的问题,相关问题的研究也受到研究者的广泛关注。法律文书的命名实体识别,作为司法人工智能领域的关键性和基础性的工作,在法律问答、刑期预判和司法知识图谱构建等任务中起着重要应用。命名实体识别的研究推动了司法人工智能下游任务的发展,但目前司法命名实体识别的研究还处
雾霾是一种常见的大气现象,是空气中悬浮的微小颗粒物(灰尘、烟、微小水滴等)组成的气溶胶系统。在户外拍摄图像时,雾霾的存在常常会使得拍摄的图像出现对比度降低、整体色彩变淡等现象,导致图像的可视化效果变差,影响到后续的高层计算机视觉任务。因此,去除图像中雾霾的影响是一项很有意义的研究。对于图像去雾问题的研究,主要有基于图像增强、基于物理模型和基于深度学习这三种类型的方法。基于增强的方法属于较早期的研究
随着政务系统信息化程度的不断提高,各级政府机关在日常工作中积累了大量的数据。一方面,这些宝贵的数据资源有助于提高各职能机构的运转效率,促进社会经济发展;另一方面,由于政务数据的专业性和复杂性,使得人工提取数据中蕴含的海量信息变得难以实现。近年来自然语言处理技术的飞速发展,为信息自动化提取和数据高效利用奠定了坚实基础。然而政府机关对数据精度的要求较高,现有的算法未能充分利用该领域的文本特征,不能很好
神经机器翻译系统在双语句对齐资源丰富的场景下可以提供最先进的翻译性能。然而,对于医疗领域,域内语料资源的稀缺严重影响了翻译系统的性能。同时,医疗领域存在着大量的医学术语,机器翻译系统在低频术语的翻译上也往往表现不佳。面向双语句对齐资源丰富的新闻领域,提出了一种融合数据增强与多样化解码的神经机器翻译方法。首先,对语料中不同种类的未登录词进行泛化以缓解词汇稀疏的现象。其次,采用数据增强中的正向翻译技术
随着国内土木工程结构向着高度更高、跨度更大、结构形式更加复杂的方向发展,对大型复杂结构进行模态测试,获取结构的动力学特征,并以此进行状态评估与安全预警,已成为学界关注的热点问题。如何从大型复杂工程结构上采集到更加准确完整的结构响应,是模态测试首先需要解决的问题。国内外学者为此提出了一系列测点优化布设评价准则,用以指导测点位置的选择,提升模态测试中信息采集的准确性。但是利用这些准则选取测点需要以结构
人体运动识别作为计算机领域的前沿方向,具有十分重要的研究意义,相关算法可以被应用到许多领域,例如动作内容分析、人机交互、视频合成、视频检索等。特别是近几年来短视频平台的高速发展,使得相关的人体动作视频越来越多,对于这些视频信息的处理研究都需要有高效准确的识别算法作为支撑,因此研究人体动作识别算法在计算机领域势在必行。在人体动作识别的算法研究中,有很多经典的视频分类数据集,例如UCF101、HMDB
脑肿瘤分为恶性脑肿瘤和良性脑肿瘤,前者是癌性的,容易扩散到大脑的其他部位,后者则不然。然而,在这两种情况下,脑肿瘤在刚性脑部空间的生长都可能导致人体功能障碍,甚至危及生命。脑肿瘤的发病率正在逐年增加,对公共卫生造成了极大的负担。诊断脑肿瘤的主要方法为利用脑部核磁共振成像图(MRI)对脑肿瘤区域进行分割,然而目前对脑肿瘤进行分割仍由脑外科医生手动进行。以这种方式分割需要花费脑外科医生大量的时间进行标
图像语义分割技术是计算机视觉领域中的一项重要的研究内容,在无人驾驶、医学影像、场景理解等领域中都有着不可或缺的作用。近几年随着深度学习的飞速发展,图像语义分割技术的整体性能得到了巨大提升,但深度学习模型对于大规模高精度数据集的依赖也成为了很多算法在泛化性和鲁棒性上的主要瓶颈。高精度的语义标注需要大量的人力和时间成本,如何在短时间内实现准确的数据标注,是图像语义分割技术面临的主要挑战之一。针对这一问