论文部分内容阅读
本实验室在过去的十年里积累了大量的实验数据,先后构建了一个用籼稻明恢63全生育期的15个组织制备的平衡化cDNA文库和一个含有12万多水稻突变体家系的资源库,这为建立本地化的生物信息学平台和系统分析大批量水稻数据提供了良好的基础。在前人的基础上,本研究主要从以下几个方面开展了工作: 1.随机对明恢63均一化cDNA文库超过4万个克隆进行5’末端测序,获得了39208条籼稻表达序列标签(EST),构建了一个基于这些数据的水稻EST数据库(REDB, http://redb.ncpgr.cn)。 2.将原始EST序列,通过去污染、精处理及应用ESTClustering程序分析,得到了17835条唯一序列,每条序列都初步认为代表一个唯一基因。在这些序列中,2663条是新的,并且至少70条是籼稻所特有的。 3.用三种方法将明恢63序列与大量来自GenBank中的EST和全长cDNA比较,在亚种间和亚种内水平均发现了大量插入、缺失和替换等多态性现象。对比全部的表达序列间的多态性,亚种间的出现频率要高于亚种内的。但是,不同的分析方法以及在不同水稻品种进行各种多态性分析的结果是不稳定的。 4.总共有15726条唯一序列,包括697新的序列,被定位到前人工作中检测到的大量农艺性状的数量性状位点(QTL)所在区间。这些结果可用于开发遗传图谱上的新分子标记,检测与水稻品种间表型变异相关的等位多态性,以及通过候选基因法来加快QTL克隆。 5.籼亚种栽培稻占有世界水稻产品的最大面积,本研究首次对来自籼亚种水稻cDNA序列进行的系统分析,因此将对所有EST序列系统分析的结果包括聚类信息、功能分类、多态性数据、染色体定位信息、EST和QTL整合图谱等信息都集成到了水稻EST数据库中。 6.收集了大约12.9万个由Enhancer trap系统得到的T-DNA插入突变体信息,构建了集管理和检索为一体的水稻突变体数据库(RMD, http://rmd.ncpgr.cn)。收集到水稻突变体数据库的信息包括突变体表型、报告基因表达模式、T-DNA插入位点的侧翼序列、种子等,这些都可以在网站上通过各自的ID、关键词、核苷酸序列或蛋白质序列检索得到。