论文部分内容阅读
基因组测序是生物信息学中最基本的研究方向之一,然而大多数生物的基因组都不可能一次性获得,需要利用序列拼接技术对实验中获得的DNA片段进行拼接操作。目前,测序过程中获得的DNA片段越来越短,基于Euler路径的拼接算法在处理这种短片段拼接时具有优势。在Euler路径算法中,一个关键的步骤是deBruijn图的构建,一直以来,构建deBruijn图的方式总是让后一个κ-mer与前一个κ-mer之间有κ-1个碱基的交叠,相邻的两个κ-mer之间相互错开一位。但文中的研究发现,如果有边连接的两个κ-mer之间有κ