基于GPU的SIFT和SURF算法的研究与实现

来源 :广东工业大学 | 被引量 : 9次 | 上传用户:qq77880066
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像特征提取与匹配是计算机视觉领域的基础研究问题,也是该领域的研究难题。在过去的数十年内,该问题持续是热点研究问题,国内外很多专家学者相继提出了很多特征提取与匹配的方法和理论,主要包括以SIFT、SURF为代表的局部特征提取算法。算法的各种变体在速度上都优于SIFT和SURF算法,然而,实验表明变体的准确率却远不如它们本身,所以研究SIFT和SURF算法的并行化优化成为当下一个重要的研究课题。图像处理的GPU优化成为解决该问题的一把利刃,GPU架构是专门为存在大量数据运算的应用而设计的,NVIDIA公司于2006年提出的基于GPU的CUDA编程架构更是把应用GPU编程实现图像处理优化问题的难度降到最低。本文主要工作是SIFT和SURF算法的GPU优化研究。文中所使用的GPU平台是NVIDIA公司的GTX550Ti。本文的重点研究问题是如何充分挖掘算法的内在并行性和如何充分利用CUDA架构的各种利于并行计算的软硬件优势。根据文献[9]提出的6个优化量度:程序的可并行度、每像素的浮点计算量与访存量比、每像素的浮点计算量、每像素的访存量、分支差异性、任务依赖性,对SIFT和SURF算法进行优化加速。对CUDA架构的分析将从硬件和软件两方面进行,根据硬件参数设计合适的线程格和线程块有利于合理充分的调度和利用GPU的硬件资源。从内存模型和线程模型两个方面来分析软件架构,CUDA提供了多达6、7种类型的内存,每种内存都有专门的用途,充分理解它们的作用和合理的利用有限的各种内存资源常常会达到意想不到的加速效果;合理的分配主机端和设备端的软硬件资源将明显的提高程序的性能,简化算法的并行逻辑,使得算法可以很好的应用于实时性要求较高的应用领域。实验表明,本文提出的SIFT和SURF算法的CUDA优化实现在各个阶段都有数倍到数十倍的提速效果。
其他文献
物联网是二十一世纪建立智慧地球的重要内容,并吸引了广大研究人员的注意力。物联网致力于连接所有人类可以触及使用的对象设备,并将相关的信息纳入到人类可使用可控制的范围
尽管电动汽车市场增长迅速,但由于电动汽车电池容量有限和充电不便,大众仍然普遍担心电动汽车的用户体验。现有的与电动汽车服务相关的研究工作大多都假定所需的数据是已知的
随着在线社交网络的逐渐兴起,越来越多的互联网用户开始广泛通过在线社交网络发布信息、传递资源和维护各种社会关系。由于在线社交网络的参与群体和内容形式的多样性,网络资
数字图书馆作为知识和信息的重要载体,受到世界各国的关注。随着数字图书馆中资源规模的不断扩大,如何快速获取用户需要的资源成为一大难题,而个性化推荐是解决这一问题的重要方
学位
随着现代装备的多样化和复杂化,传统的纸质技术手册存在的数量膨胀、成本高昂和更新困难等问题日益突出。S1000D作为一个国际技术出版物规范,它的数据重用等特性,能有效支持
直接建模技术作为实体建模技术的最新发展,近年来受到工业界的广泛重视。直接建模的主要特点在于无需关注建模历史,直接在边界表示模型上进行编辑操作,因此它是一种十分方便、高
近些年,云计算的出现对IT界甚至是是人们的日常生活都产生了深远的影响。OpenStack也是最近几年出现的一个开源云计算IaaS平台,受到广泛的接受与好评,涌现出许多基于OpenStack的
文物是我国五千年的辉煌文明历史遗留下来的珍宝,具有重要的历史、艺术与科学价值。然而由于环境与本身内在因素,文物正在逐渐损坏,传统文物的保护工作也无法从根本上保护好文物
舌诊是一种重要的中医诊断方式,由于长期以来是以医生主观判断为主,阻碍了中医的发展,因而实现中医舌诊的客观化,对中医现代化具有重要意义。舌象采集作为舌诊系统的基础部分