论文部分内容阅读
本文的研究对象是现行所知的作为生命关键组成部分之一的一类生物分子一核糖(RNA)分子。之前的研究发现,RNA二级结构以及RNA伪扭结结构在我们自然界生命职能中起着极其重要的作用,并且一部分RNA在分子中具有反应活性。更重要的是对伪扭结结构的研究可以使我们更进一步的了解其空间结构和性能。然而目前对RNA分子序列结构关系的研究大部分还仅仅停留在二级结构的层面上。在本文中我们将对RNA序列结构关系的研究拓展到了伪扭结结构层面上来,涵盖了三不交和拓扑第一类伪扭结RNA等研究内容,主要包括以下4个章节。
第一章,介绍相关背景知识。首先描述了所研究的RNA模型以及二级结构、伪扭结结构的定义和刻画方式。RNA序列和结构之间的关系可以看作是从序列空间到结构空间的一个由某个折叠算法导出的多对一的映射。在这个映射中,每一个序列对应一个最小自由能结构。同时给定一个RNA结构,它的原象即所有折叠成该结构的序列形成一个连通的中立网络。在最后我们重点介绍了二级结构的相关结果和RNA结构的基本组成元素。
第二章,我们对从RNA序列到三不交伪扭结结构的映射进行了多种统计分析。从分析中得到了一些RNA中立网络的重要特性,包括伪扭结率、支配伪扣结结构形状分布、中立路、中立邻接情况和局部连通性等。此模型不仅使我们可以了解序列和结构之间的关系,而且可以用来研究中立性对RNA进化的影响。研究结果表明:同二级结构相比,三不交伪扭结结构更适合用来研究分子的中立进化性。从而最后进一步得出结论,伪扭结结构RNA存在中立网络。
第三章,我们设计出RNA反预测启发式算法。在研究自然界RNA结构、搜索新核糖体、设计人工RNA过程中,找到能够折叠成某个特定结构并进一步分析他们所形成的中立网络性质显得尤为重要。但是现存的RNA设计算法,包括RNAinverse,RNA-SSD和INFO-RNA等,仅仅能够满足于对二级结构的处理。为解决这一矛盾,我们给出了一个启发式算法Inv,设计对象是三不交标准伪扭结结构,这是将RNA结构设计能力拓展到伪扭结结构的第一个算法。通过实验验证,本算法不仅可以设计不交RNA结构序列,更重要的是可以设计伪扭结结构序列。此算法可以用来研究RNA的结构和职能,为作为处理一些未解决的医学问题的提供有效工具。除此之外,我们通过将二相容序列的思想和Inv相结合,使得可以用此来衡量两个不同中立网络之间的距离。此算法的ANSIC99实现可以从网站 HTTP://www.combinatorics.cn/cbpc/inv.html自由免费获取。
第四章,我们研究从RNA序列到第一类拓扑结构的映射性质。对这一类伪扭结RNA的统计特性作出分析,同时将之与通过折叠大量随机序列生成的最小自由能的同类结构数据相比较。碱基对、螺旋棒、针头圈、凸圈和内圈等是RNA结构的基本组成元素,通过计算它们的二维生成函数并运用中心极限定理的方法来分别分析它们个数的分布情况,得出的结果表明这五种组成元素都是随着分子结构长度的增加呈线性递增。同时,对给定的一个足够大的长度n,在2≤T≤7的取值范围内,碱基对的平均个数nT是与T成正比,然而螺旋棒、针头圈、凸圈和内圈都与r成反比。碱基对和螺旋棒对一个RNA的结构稳定性起着积极的作用,但是圈包括针头圈、凸圈和内圈在内,却起了消极的作用。通过分别将它们的极限分别和实验室随机最小自由能数据进行比较,发现在最小自由能RNA结构中明显地更倾向于存在更多的碱基对,更少的螺旋棒和圈。这个发现正好与RNA结构的自由能模型一致。