面向体系结构的串匹配算法优化研究

来源 :中国科学院计算技术研究所 | 被引量 : 5次 | 上传用户:sakuma556
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
串匹配算法广泛应用于生物信息学、信息检索等领域。随着基因数据和网络数据的爆炸式增长,对串匹配算法的性能也提出更高的要求。 本文从计算机体系结构的角度出发,立足于开发串匹配算法的数据并行性和提高算法的cache性能。本文的主要工作包括: (1) 基于SIMD指令集的动态规划算法数据并行性开发与实现研究。 动态规划是模糊串匹配和序列联配中的基本算法。一类动态规划算法以Smith-Waterman算法为代表,计算复杂度为O(n2);一类是以Zuker算法为代表,计算复杂性为O(n3)。本文分析了两类动态规划算法的数据依赖关系及其数据并行性。基于前驱计算思想,优化设计了Smith-Waterman算法,充分挖掘了算法的数据并行性,并基于SIMD指令集实现,数倍提高了该算法性能。通过设计辅助矩阵,有效组织数据,优化设计了Zuker算法,对于较大的数据规模,获得了接近理论值的加速比。 (2) 基于组合字符集的高性能shift-or算法研究 Shift-or算法广泛应用于内容过滤领域。基本的shift-or算法以char类型的字符集合作为字符集,因而状态转换单位为8bits。本文通过组合NFA的状态,建立∑short上的NFA,状态转换单位提高为short型整数,显著降低了自动机状态转换次数,提高了计算效率。 (3) 面向位并行的低内存开销高性能关键词表达式匹配算法研究 关键词表达式匹配算法是一类重要的串匹配算法。本文面向位并行,利用four-russian和分治等优化方法设计了新的关键词表达式匹配算法,可提高计算效率、降低内存开销。
其他文献
在现实世界中,相当一部分具有模糊性的信息是Fuzzy集理论无法表示和处理的,而Vague集能够表示和处理更为丰富的具有模糊性的不确定性信息。采用Vague集来进行模糊信息处理的研
专家系统设计在它的核心部分——不确定性推理理论与方法上,一直以来都存在着不足。关于它的理论和应用有充分的空间待于发展。从有专家系统起,不确定性知识的表示和处理就是
随着软件产业的快速发展,软件规模越来越大,软件也变得越来越复杂,这些因素都使软件质量越来越难得到有效的保障。软件测试是保证软件质量的重要手段,如何使用有效的测试方法和合
语义Web的提出和发展给Web服务带来了新的活力。用语义Web的知识标记手段描述Web服务的语义,使Web服务成为计算机可以理解的实体,从而支持服务的自动发现、组合和执行等,就是倍
当越来越多的公司及政府部门将其核心业务向互联网转移的时候,网络安全作为一个无法回避的问题呈现在人们面前。传统上,公司及政府部门一般采用防火墙作为其安全防线,而随着攻击
近年来,脆弱性水印技术随着多媒体信息认证业务的发展而逐渐成为研究热点之一。各种方案层出不穷,但众多现有方案在面对实际需求时,却往往无法达到预期的认证效果。本文从图
计算机三维设计作为一个新兴产业,新艺术和新媒体提供了广阔的发展空间。但是在计算机三维设计技术高速发展的同时,也存在繁重低效的过程,也就是“渲染瓶颈”。为解决此问题,
当今流行的即时通讯系统有MSN、Yahoo Massager、ICQ、QQ、Google Talk等,但是这些IM系统基本都定位于个人用户,面向最广泛的群体,在商业应用中如果想要给本行业客户提供一个
教学楼的疏散方案是保障教学楼内师生生命安全的重要依据,制定科学有效的人员疏散方案有着重大的现实意义,近年来疏散方案成为了一项非常热门的研究课题。目前国内外对教学楼内
随着Internet的迅速发展,如何在浩瀚的网络信息资源中查询自己想要的信息变得越来越重要。通用的搜索引擎在一定程度上满足了用户的搜索需求,但是它们未考虑用户的个人兴趣与