基于RNA-Seq数据集的转录组从头拼接算法

来源 :计算机科学 | 被引量 : 0次 | 上传用户:q815034246
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
转录组拼接是基因组测序与功能注解问题的一个重要组成部分。为了提高转录组拼接的精度和效率,文中提出了一种新的转录组从头拼接算法StepLink。该算法的主要创新点是提出了最左k-mer(长度为k的短序)和右k-mer的概念,并运用双重哈希表来存储相邻的每对k-mer,使得拼接更加迅速、准确。应用该算法对SRA数据库中人、狗和老鼠的测序数据分别进行拼接,结果表明该算法比其他已有算法更高效。
其他文献
借鉴高阶矩的方法,采用层序的计算框架,依据结点的连接距离和层序信息定义了20种结点不变量。这些结点不变量体现图整体的上下偏分布特性、整体不均匀性和整体平滑性,结点不
I/O任务调度是影响I/O密集型虚拟机性能的重要因素。现有调度方法主要是针对虚拟机整机I/O带宽的优化,较少兼顾各虚拟域与全局性能,也无法满足域间差异化服务的要求。针对现有方法
随着互联网经济的不断发展,越来越多的商户选择利用互联网终端进行账本管理。但是,常常会由于人为因素导致账本丢失、数据被篡改、商户双方信任危机等一系列问题。通过梳理当
为了更好地在向量化时读取离散的数据,Intel在HaswellCPU提供了AVX2vgather指令。由于Stencil在设置边界条件时使用了条件判断,因此编译器生成了vgather指令,并降低了Stencil在H
由于云平台架构的复杂性和工作负载的不可预测性,云监控对保证云平台的高可用性有重要意义,云平台上资源的动态性、多样性以及资源规模巨大给云平台监控带来了一定的困难。研究
针对传统的电路板测点选取方法需要的输入信息多、工作繁琐、效率低及难以得到全局最优解等问题,提出了一种基于多信号模型与遗传算法相结合的优化方法。首先,通过建立板级电