BioIndex:一种生物序列相似性查询的高效索引

来源 :计算机应用与软件 | 被引量 : 2次 | 上传用户:everywherecsu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
有效管理生物数据并提供高效的查询方法是生物信息处理的重要研究内容。BioSeg是一个新的生物序列数据模型。查询优化研究是生物数据库管理系统开发的重要内容之一。研究当前生物数据索引技术,针对BioSeg数据模型的特点和生物序列相似性查询需求设计了一种新的生物序列数据索引BioIndex,并设计相应的查询算法。首先,使用MEME(Multiple EM for Moeif Elicit-ation)算法挖掘生物序列集中的序列模式作为索引建立索引序列库;之后,在索引序列库中查找与查询序列最相似的索引序列,
其他文献
传统的直接模拟Monte Carlo(DSMC)方法大部分应用于稀薄气体的数值模拟计算,在较高密度和较大尺度模拟的情况下该方法需要的大计算量限制了其向更广泛领域发展。结合高性能计算发展带来的契机,提出利用并行化作为提升DSMC方法计算效率的手段,以推动更多对DSMC的研究,使其使用范围得到发展。对DSMC方法进行并行化分析,发现其属于不易并行的方法。同时根据分析结果提出了全局网格并行化解决方案,通
该文通过对RDO数据接口和常用对象、方法及属性的描述,分析使用RDO接口的注意事项,介绍了对典型错误的快速处理方法和思路。
2008年11月5号,由北京红旗中文贰仟软件技术有限公司和北京大学承办的第6届OpenOffice.org世界开源大会在北京钓鱼台国宾馆隆重开幕。工业和信息化部软件和服务业司副司长陈