论文部分内容阅读
水稻是重要的粮食作物,也是单子叶植物研究的模式生物。大片段基因组文库和物理图谱在基因组的比较分析、基因组序列拼接等研究工作中有重要的价值。在本研究中,通过对BAC文库进行指纹分析,构建了水稻品种中花11和93-11的物理图谱,并将它们分别用于比较基因组分析和WGS基因组序列的组装。中花11因在农杆菌介导的遗传转化中有较高的转化效率而成为遗传转化的重要材料,被用来构建了大量的T-DNA插入突变体,方便了许多重要功能基因的鉴定、分离和研究。本研究构建物理图谱时所使用的中花11基因组BAC文库,由36864个克隆组成,空载率为0.45%,插入片段平均大小为124Kb,并对其中18432个BAC克隆进行双末端测序和指纹分析。末端测序获得了35919条总长为24072531bp的BES(Q≧16,length≧100bp),成功率为97.43%。通过末端序列估计文库中来自细胞器基因组DNA片段的污染比例约为5.93%,中花11基因组的重复序列所占的百分比约为31.93%,并发现了18个在中花11基因组中特有的高频出现的片段,其中4个片段仅在O. rufipogon中高频出现,4个片段仅在O.australiensis中高频出现。指纹分析获得了17527个克隆的指纹数据,成功率为95.1%,利用FPC将其中的16042个克隆组装成648个Contig,剩下1485个Singletons。利用BES将其中的575个Contig定位到了日本晴基因组序列上,获得了比较物理图谱。从比较物理图谱中,可以观察到中花11和日本晴基因组之间具有高度的保守性和共线性。在克隆重叠群水平上,发生扩增(Expansion)和压缩(Contraction)的区段最大不超过140Kb。从中花11BAC克隆末端序列与其在日本晴、93-11基因组序列中同源序列间的比对结果中可以看出:1)亚种间(中花11和93-11、日本晴和93-11)的变异程度相差不大,但都高于亚种内品种间的变异(中花11和日本晴)程度;2)发生在中花11序列中的替换突变率(47.2%)与发生在日本晴序列中的替换突变率(52.6%)相差不大;3)发生在中花11序列中的插入缺失突变率比发生在日本晴序列中的插入缺失突变率要高出很多(约15.8倍)。根据中花11BAC克隆末端序列以及日本晴和93-11基因组序列中同源编码序列间的同义替换率估计中花11与日本晴、中花11与93-11、日本睛与93-11分别分化于大约13、39和50万年前。中花11物理图谱中覆盖口本晴基因组序列空缺克隆重叠群为探索序列空缺区段内的特殊结构提供了线索。中花11物理图谱中整合的T-DNA插入突变体侧翼序列为物理图谱在基因功能分析中的应用提供了便利。BGI公布的93-11基因组序列在组装过程中参考了Kasalath的BAC末端序列,日本晴的基因组序列等其它品种的遗传信息,而品种间固有的差异可能会误导基因组序列的组装,因此构建了93-11的物理图谱以指导其WGS序列的组装。构建物理图谱所用的BAC文库包括36864个克隆,根据其中32205个克隆的指纹数据,将30938个克隆组装成285个克隆重叠群。对文库中的克隆进行末端测序,获得了总长为39864033bp的65119条末端序列。利用这些末端序列与日本晴和93-11基因组序列进行比对,269个克隆重叠群比对到了日本晴基因组序列上,272个克隆重叠群比对到93-11基因组序列上。371对末端序列在日本晴基因组序列上的匹配方向表现出异常,可能是因为物理图谱组装有错误,也可能是因为日本晴基因组序列组装有错误,还有可能是因为者品种间存在着固有的差异。406对末端序列在93-11基因组序列上表现出异常,可能是因为物理图谱组装有错误,也可能是因为93-11基因组序列组装有错误。从7个在日本晴和93-11基因组序列上比对不一致的克隆重群中挑取克隆与93-11基因组序列进行FISH杂交,结果显示物理图谱的组装没有错误,从而说明利用物理图谱的提供的框架对93-11的WGS序列进行矫正,可以进一步提高93-11基因组序列的质量。