【摘 要】
:
多序列星比对算法在确定中心序列时需要计算任意两个输入序列的距离及分数,其较高的时间复杂度耗费了大量时间,因此提出了通过综合计算每个序列产生的k-mers及各个k-mer在各
【机 构】
:
内蒙古农业大学计算机与信息工程学院
论文部分内容阅读
多序列星比对算法在确定中心序列时需要计算任意两个输入序列的距离及分数,其较高的时间复杂度耗费了大量时间,因此提出了通过综合计算每个序列产生的k-mers及各个k-mer在各序列中出现的次数来确定k-mers的拼接选择,由k-mers进行拼接从而得到中心序列。进而,在双序列比对过程中采用搜索两个序列最大相似子串的思想,改进的星比对算法的精度在一定程度上得到了明显提升。接着,将改进的星比对算法在Spark中进行并行化设计与实现。采用Spark的Yarn-Client运行模式,对正常人线粒体的多组数据进行实验,
其他文献
DNA传感器以DNA为敏感元件 ,通过换能器将DNA与DNA、DNA与RNA及DNA与其它有机无机离子之间的作用的生物学信号转变为可检测的光、电、声波等物理信号。近年来 ,DNA传感器在基因诊断、环境监控、药物研究等领域的应用研究受到广泛重视
与经典粗糙集相比,传统的决策粗糙集将代价考虑在内,利用代价矩阵生成一对阈值。但决策粗糙集不具备经典粗糙集的单调性,这为粗糙集的属性约简带来了新的挑战。传统的决策粗
描述了近十年来用作NO2气体传感器的酞菁类和氧化物 半导体敏感材料。总结了这两类材料的成膜条件、薄膜表面形态和结构以及它们的敏感特 性。为优化薄膜的气敏特性提供了参
BPMN 2.0已成为了建模业务过程事实上的标准。BPMN 2.0过程模型中建模元素的混用会产生控制流方面的语义错误。首先,建立了BPMN 2.0过程模型到工作流网的映射,并使用Petri网
模糊粗糙集作为模糊集与粗糙集的结合体,能够有效处理数据的复杂性和不确定性。由模糊相似关系产生的模糊粒结构可以对模糊粗糙集中不确定性的概念进行近似。核函数和模糊相
双分子层脂质膜(BLM)具有生物细胞膜的生物兼容性,是固定生物活性物质的理想材料,因此其在生物医学研究和生物传感器的研制领域具有广泛的应用前景。介绍了BLM的特性及其修饰,评