基于遗传算法的含假结的核酸二级结构预测研究

来源 :武汉科技大学 | 被引量 : 0次 | 上传用户:shmilyxin2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
DNA和RNA核酸分子在生物的整个进化过程中是不可缺少的一部分。近年来随着生物技术的发展,经过优化设计的核酸分子的自组装技术在生物分子计算、生物传感器、靶向药物治疗等领域也有着重要应用。在这些领域中,核酸分子的优化设计和结构预测是一个重要的研究内容。核酸分子可以通过碱基的氢键吸引,折叠自身而形成多样的二级结构。任意的单链核酸分子都存在海量的碱基匹配组合,究竟哪种匹配的结构是核酸分子最稳定的结构是个复杂的组合优化问题。此外,包含假结的核酸分子二级结构预测问题已被证明是一个NP完全问题。因此,预测含假结的核酸分子的二级结构是一个重要的热点问题和难点问题,具有重要的理论意义和应用价值。目前,国内外许多学者已提出了预测核酸分子二级结构的各种算法。在目前已有的算法中,精确算法在核酸分子规模较小时有不错的搜索效果,但随着核酸分子碱基数量的增多,这些精确算法就显得有些无能为力,无法在有限的时间内预测出核酸分子的结构,且传统的动态规划算法无法预测出假结;另一方面,有些近似算法虽然能够处理碱基数量较多的核酸分子序列,但收敛速度过慢。通过对PseudoBase数据库中含假结的RNA分子进行观察,虽然这些RNA分子二级结构的圆顶图存在交叉的边,无法用传统的动态规划算法求解,但是这些图实际上都是可平面图。本文提出一种基于遗传算法的含假结的二级结构预测算法,允许在RNA分子骨架的下方连接氢键形成可平面的假结,最大程度地降低核酸分子的自由能。算法用茎区的长度和自由能一起作为作评估个体的标准,针对核酸分子的特点,提出了改进的交叉、变异遗传算子。本文利用PseudoBase数据库的核酸实例进行了测试,并与ProbKnot、Mfold、HotKnots等其它著名的核酸二级结构预测算法进行比较,分析结果证明了本文算法的有效性和可靠性。为了进一步提高求解较长的核酸分子的计算效率,本文选择了NVIDIA公司推出的CUDA并行计算模型,将遗传算法中种群初始化、适应度计算、选择、交叉、变异等重要的遗传算子进行并行化,利用GPU进行并行计算。实验结果表明,和传统的基于CPU的遗传算法相比,这种基于GPU的并行计算模式可以显著提高算法的效率。
其他文献
优化问题在现实生活中无处不在,为此,学者们提出了进化算法以求解这些问题。近邻场优化算法作为一类较新的进化算法,已应用于多个领域。不同于其他算法的优化机制,其利用局部
随着军事现代化的加速,先进的数字波形生成技术与处理技术不断涌现,使得大批新的雷达波型被设计出来,雷达信号变得更加多样化和复杂化。同时现代电磁环境也愈加复杂,对极端条
由高光谱传感器捕获的高光谱图像(Hyperspectral Image,HSI)是一个三维数据,包含两个像素空间维度和一个光谱维度。通常,高光谱图像包含高的光谱分辨率来描述场景中不同材料
产业集聚是产业空间分布的形式之一,企业、相关企业及科研机构等集聚于某一区域,人与人之间的互动与交流推动了知识在区域内的传播和扩散,产生的知识溢出效应促进了技术创新
西北盐政,在民国以前未设专管机关,至1914年,始设花定榷运局于兰州,总揽征榷缉私全权。1917年,盐务稽核总所添设花定收税局,专司征税及稽核事宜。1927年4月,甘肃军政当局,合
多溴联苯醚(Polybrominated Diphenyl Ethers,PBDEs)、邻苯二甲酸酯(Phthalate Esters,PAEs)和双酚A(Bisphenol A,BPA)作为三类典型的环境内分泌干扰物(Environmental Endocrine Dis
行人目标检测与跟踪技术在安防监控、智能交通、人机交互等领域都具有重要的研究价值和应用价值。实际应用环境中,由于跟踪场景多样性和行人目标变化复杂,传统的经典核相关滤
温室栽培作为一种高度集成的设施农业,在提高农业生产效率和解决世界粮食短缺问题上正变得越来越重要。尽管意义重大,但现代温室栽培仍面临高投入、需要频繁投入专业人力、高
机器人关节是机械臂类机器人的关键部分,其性能的优劣,直接影响到机械臂的精度和性能。传统的工业机械臂,无法调和大输出力矩和高柔顺性的矛盾。本文针对工业生产的需要和人
根据国家对煤矿“六大系统”的建设要求,目前大多数煤矿已完成了通讯联络系统(程控电话、无线通信、应急广播)的建设,但各系统建立时间不一、相对独立、缺乏联动,成为系统“