论文部分内容阅读
大多数农艺性状都是数量性状,受多个基因位点共同影响和控制。这些基因位点不仅可能产生单独影响,还可能产生上位性互作效应。基因位点产生的效应大多数对环境敏感,存在基因与环境互作。传统的遗传研究方法通常用于分析较小的试验群体数据,分子标记密度较稀疏,并且仅对单个数量性状分析。然而数量性状的复杂性在生物体中的不同层次都有体现,如DNA水平,RNA水平,蛋白质水平,代谢水平,表现型水平等。为了进一步研究农作物遗传机理,研究者通常采用自然群体或者复杂的试验设计,收集一系列相互关联的农艺性状。此外,随着生物技术的快速发展,收集和获取高通量数据越来越容易和自动化,先进的技术手段被应用于农作物研究中。例如,在DNA水平中,由于快速测序和测序成本逐渐降低,SNP标记开始代替传统分子标记用于农业作物研究和应用中;在RNA水平中,研究者把基因芯片数据与其他实验数据结合一起深入研究作物遗传结构。这些给遗传统计分析方法带来巨大机遇和挑战。本文就目前农业复杂性状遗传分析中遇到的若干问题为出发点,提出了一些相应的统计分析方法,并通过蒙特卡洛模拟和实例分析验证这些方法的有效性和可靠性。全文共分为四章,主要内容概括如下:第一章首先简单介绍目前农业复杂性状遗传分析中遇到的若干问题以及相关的统计遗传学分析方法。由于本文涉及到统计检验和效应值估算等统计分析方法及其原理,因而简要地介绍了这些相关的统计方法。第二章针对传统QTL连锁定位方法遇到的问题,我们进一步拓展了分析方法。本章共分为两个个小节,1.第一节介绍三位点上位性互作的搜索方法和策略。位点之间的上位性是影响复杂性状表现型变异的重要原因,许多文献证实了上位性的存在。此外,上位性被认为是遗传率缺失的重要因素,准确估计上位性有助于提高个体基因型预测值,对作物育种、疾病预防都有重要价值。然而目前主要的QTL定位方法尚无法定位三位点上位性互作。鉴于此,我们提出三位点高维互作的定位方法和策略,并通过一系列蒙特卡洛模拟验证该定位方法的有效性和准确性。2.第二节介绍多个数量性状联合QTL定位方法。农业研究领域中,一个复杂性状往往与其他多个性状具有不同程度的相关性。传统的基因定位方法仅局限于分析单个性状,忽视了性状之间的相关信息。这会带来一些问题,如不能很好控制一类错误。因而我们提出了多性状联合基因定位方法,采用Wilks’Lambda统计量检验单位点和二互作上位性,并用置换检验控制整个基因组的假阳性发生率。随机模拟验证了该方法的可行性和有效性,并且在水稻和小鼠的实例分析中我们搜索到多个显著位点。第三章我们提出针对高通量数据的全基因组关联分析方法(GWAS)。本章也分为两小节,1.第一节介绍基于SNP标记的提出了数量性状SNP(QTS)关联分析方法。由于高通量生物技术不断发展成熟,SNP标记被广泛使用,关联分析方法也随之成为常用的分析工具。我们就目前常用的统计分析方法中存在的问题,提出了基于混合线性回归模型的QTS关联分析方法,把上位性检验以及位点与环境互作检测整合在一个模型中,采用F测验检验位点显著性,运用置换检验方法控制假阳性发生率。蒙特卡洛随机模拟和小鼠实例数据验证了方法的可行性和有效性。2.第二节介绍可对数量性状转录座(QTT)、数量性状蛋白座(QTP)和数量性状代谢座(QTM)作关联分析的方法。基因芯片是研究生物复杂性状的重要工具。已被广泛应用于疾病诊断,药物筛选,农作物育种等诸多领域。与传统的聚类分析和eQTL、pQTL定位不同,我们提出的QTT/P/M关联分析方法基于连续型性状变异,搜索与其显著相关的转录座、蛋白座和代谢座位点,包括单个显著位点和成对位点之间的上位性互作。蒙特卡洛随机模拟验证了该关联分析方法的可靠性与有效应。并且在小鼠的实例研究中,我们不仅找到了显著的转录座位点,并把结果与QTS关联分析以及QTL连锁分析定位结果结合,更进一步了解基因作用方式。第四章介绍QTXNetwork定位分析软件QTXNetwork是一个遗传分析软件,基于C++语言开发,具有可视化界面。其适用性广,包括QTL连锁定位分析,SNP关联分析和转录座关联分析。QTXNetwork目前版本具有以下几部分功能:1.搜索候选数量性状基因座(QTL)、数量性状SNP(QTS)、数量性状转录座(QTT)、数量性状蛋白座(QTP)和数量性状代谢座(QTM)包括显著关联的单位点,上位性位点;2.估算显著位点的遗传效应值和遗传率,包括主效应,与环境互作效应,以及相对应的遗传贡献率;3.最佳基因组合和相应遗传效应预测,根据各个显著位点和相应的遗传效应估计值,预测在每个环境中的最佳基因位点组合和相应的遗传效应;4.样本个体的遗传效应值预测,根据各个显著位点和相应的遗传效应估计值,预测每个样本个体的遗传效应值,并列出效应值最大和最小的一些个体。此外,QTXNetwork的使用简单,操作方便。