基于GPU图像搜索中文本检索的关键技术研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:birdlay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
Web图像搜索是一门通过抽取网页中存在的图像信息并建立索引供用户查询的技术。基于关键词的图像搜索是指从网页中抽取出图像的文字性语义描述,然后对其进行加工整理并建立索引的一种搜索方式。目前Web图像搜索的文本检索存在的主要问题是图像的文本语义描述不完整,检索不精确,后台数据更新周期慢等。如何精确的从网页中抽取出图像的文本语义描述并高效的建立索引方式是图像搜索中文本检索的关键问题。而随着并行计算硬件GPU的飞速发展,GPU作为一种加速工具被越来越多的应用到高性能计算领域,同时,也可应用于Web图像搜索领域。首先分析图像搜索系统中模块的执行流程及计算特点,在CPU-GPU集群服务器上构建基于内容的图像搜索系统。研究GPU上的图像文本语义抽取方法。针对网页多主题的情况,首先利用经验规则把网页分成多个主题块,然后利用主题块的标签属性提示和局部视觉特征来精确抽取图像的文本语义信息。重点研究GPU上数据处理流程及编程模型,针对GPU不支持动态数据分配的特点,通过预先申请的方法在显存内逐层构建层次型数据;通过数据流控制降低CPU相对GPU的数据处理速度的落差;利用GPU的优化特性,提出一种自适应线程分配的方法完成线程到数据的映射;通过GPU上的并行数据结构实现GPU上的字符串处理库,提高整个算法的性能。研究文本索引中的排序和查找这两个关键算法在GPU上的实现。在排序算法中,首先把整个排序过程分为几个阶段,通过GPU的流处理模式的特点实现算法的过程并行化。排序算法首先在CPU上通过快速排序把待排序的数据分成多个子序列,然后结合文本索引中数据结构的特点,在GPU上对子序列进行局部排序。算法分析了子序列归并时超过共享存储器和没有超过共享存储器两种情况,完成在共享存储器和显存上的归并过程。GPU上的查询主要利用GPU的SIMT的特点实现多数据并行查询。系统测试表明在应用基于GPU的信息抽取算法的情况下,图像的文本语义信息描述更加完整,系统的功能和性能相对CPU上的图像搜索系统都有了很大的提升。同时由于针对文本索引中的关键算法进行了改进,使得文本索引模块的执行效率也有显著的提高。
其他文献
随着信息化建设的不断推进,网络安全问题也不断突显,已经引起了企业的高度重视,越来越多的企业开始进行网络安全风险评估并制订和部署整体安全策略。网络安全风险评估有助于
近些年随着智能手机的普及和可穿戴设备的崛起,移动设备的数量呈指数级增长,移动应用的功能也趋于复杂化。尽管智能设备的硬件配置也在迅速发展,但仍然难以满足人们对移动应
多线程离散事件模拟语言(Multithreaded Discrete Event Simulation Language,下文均简称MDESL)是一种类似于硬件描述语言Verilog的基于统一程序理论(UTP)的语言,由朱惠彪教
计算机网络的发展趋势正在由独立的网络结构向分布式的多域自治网络演进。网元的工作模式已不再是“孤岛式”的,而演化成与其它网元进行分布式协同工作的模式,认知网络的出现,充
电容层析成像(Electrical Capacitance Topography,ECT)技术是一种基于电容敏感机理的过程成像技术,目前在解决工业两相流检测领域成为过程层析成像技术发展的主流和研究热点
随着社会的发展,互联网已成为信息传播和获取的重要平台,为我们进行信息交流提供了极大的便利。与此同时,互联网也成为发布虚假信息、滥发商业广告、随意侮辱他人、滥用信息
学位
随着软件丌发规模的逐渐增大,系统中界面的设计与实现逐渐成为影响整个系统效率的关键环节。对于用户来说,界面是向他们展示系统功能的平台,是对系统的性能的最好诠释。目前,
计算机图形学理论和虚拟技术的发展,使得人们逼真的模拟身边的这个世界成为可能。巍峨的高山,葱翠的林木,婉延的河流等都可以栩栩如生的展示在人们眼前。在对自然环境的模拟
随着计算机的普及和网络技术的迅速发展,网络给人们带来利益的同时,也遭受着多种形式的攻击。入侵检测作为主动的安全防护技术,有效地阻止了各种攻击。目前数据流挖掘得到人